ベクトル埋め込み
ベクトル埋め込みとは、テキスト、画像、音声、動画などの複雑なデータを連続的なベクトル空間における数値表現に変換することです。埋め込みモデルは生データを保存するのではなく、データを数値のリスト(ベクトル)に変換し、これらのベクトルの近さが元のデータポイントのセマンティックな類似性を反映します。
従来のキーワードベースの検索は、ユーザーがニュアンスのある質問をした場合に機能しません。ベクトル埋め込みは、データの意味や文脈を捉えることでこれを解決します。これにより、AIシステムは、「大型のネコ科動物」が「トラ」と意味的に近いことを理解できます。これは、単語が完全に一致しなくても可能です。この語彙一致から意味一致への移行は、現代の生成AIとインテリジェントアプリケーションの基礎となっています。
このプロセスには通常、事前学習済みのニューラルネットワーク、多くの場合Transformerモデルが関与します。このモデルは生データ(例:一文)を取り込み、複数の層を通過させます。各層が入力の理解を洗練させ、最終的に固定長のベクトル(例:768次元)を出力します。意味が類似したデータポイントは、高次元空間内で数学的に互いに近いベクトルを持つことになり、これはコサイン類似度を使用して測定されることがよくあります。
ベクトル埋め込みは、いくつかの重要なビジネス機能に力を与えています。