ハイブリッドリトリーバー
ハイブリッドリトリーバーは、2つ以上の異なる検索手法(最も一般的なのは、疎な検索(BM25キーワード検索など)と密な検索(ベクトル類似性検索))を組み合わせた高度な情報検索コンポーネントであり、与えられたクエリに対してより包括的で正確な結果セットを生成します。
最新の検索拡張生成(RAG)システムでは、取得されたドキュメントの品質が最終的なAI出力の品質を直接決定します。ベクトル検索のみに頼ると、正確なキーワード一致を見逃すことがあり、一方、キーワード検索は文脈的な理解を欠いています。ハイブリッドリトリーバーは、この制限に対処し、意味的な関連性と語彙的な精度の両方を保証します。
このプロセスでは、通常、ユーザーのクエリを2つの並行パイプライン(従来の逆引きインデックス検索と密な埋め込みモデル検索)に通します。その後、両パイプラインからの結果を洗練された再ランキングまたは融合アルゴリズムを使用して統合します。この融合ステップは、両手法からのスコアをインテリジェントに重み付けし、関連ドキュメントの単一の最適化されたランキングリストを生成します。