AI用語集へデータ活用
エンベディング
Embedding
X投稿テキスト
エンベディングとは、テキストや画像の「意味」を数値の配列に変換する技術。「類似した意味の文章を近くに配置する」ことで、AIが意味を理解した検索や分類が可能になります。RAGやセマンティック検索の基盤技術です。 #ジェネサプ #AI用語
詳しい解説
エンベディング(embedding)とは、テキスト・画像・音声などのデータを、意味を保ったまま数値のベクトル(数値の配列)に変換する技術です。「意味の数値化」と理解するとわかりやすいでしょう。
例えば「犬」「いぬ」「dog」「ポチ」はすべて異なる文字列ですが、エンベディングを使うと似たような数値ベクトルに変換されます。これにより、完全に同じ言葉でなくても「意味が近い」ものを見つけられるようになります。
RAGシステムの中核部分であり、「社内ドキュメントを意味で検索できる」という機能は、このエンベディングによって実現されています。
現場での使い方・事例
社内文書の意味検索:「有給申請の手順を教えて」という質問に対し、文書内に「年次有給休暇取得フロー」という見出しがあっても、エンベディングを使えば意味が一致するとして検索でヒットします。キーワード検索ではできなかった「意味での検索」が可能になります。
類似事例の検索:過去の提案書・サポート対応履歴の中から「今回の案件に似たケース」を自動で引き出す仕組みを作れます。担当者の経験年数に関わらず、過去の知見を活用できます。
よくある誤解
「エンベディング=RAG」は誤解です。エンベディングはRAGを構成する技術の一部です。RAGはエンベディングを使って文書を検索し、その結果をAIへの入力に加えることで、回答の精度を上げる仕組み全体を指します。
代表的なツール・サービス
OpenAI Embeddings APIDifyFlowise