Knowledge Retrieval
ナレッジ検索(Knowledge Retrieval)とは、インテリジェントシステム、通常はAIモデルが、大規模でしばしば独自の知識ベースや文書群から関連情報をアクセスし、特定し、抽出するプロセスを指します。単体の生成AIが事前学習済みウェイトに依存するのとは異なり、検索システムは推論時にコンテキスト固有の最新の事実を提供することで、モデルの能力を補強します。
エンタープライズアプリケーションにおいて、汎用的な大規模言語モデル(LLM)は、特定のドメイン知識や内部のプライベートデータへのアクセスを欠いていることがよくあります。ナレッジ検索は、AIを検証可能な情報源に根付かせることでこれを解決します。これにより、「ハルシネーション」(モデルが事実と異なるが流暢に聞こえる情報を生成すること)のリスクが大幅に軽減され、AIをビジネス上重要なタスクに対して信頼できるものにします。
最新のナレッジ検索システムは、しばしば検索拡張生成(Retrieval-Augmented Generation、RAG)を採用しています。このプロセスは一般的に以下のステップに従います。
ナレッジ検索は、いくつかの高価値なビジネスアプリケーションを支えています。
堅牢なナレッジ検索を実装することは容易ではありません。主な課題には以下が含まれます。
この分野は、セマンティック検索、ベクトルデータベース、ファインチューニングと深く交差しています。ファインチューニングがモデルの「話し方」を変えるためにモデルのウェイトを調整するのに対し、ナレッジ検索は外部コンテキストを提供することでモデルの「知っていること」を変えます。