ハイブリッドメモリ
ハイブリッドメモリとは、AIおよび大規模言語モデル(LLM)におけるアーキテクチャアプローチの一つで、複数の異なる種類のメモリストレージを統合し、同時に利用するものです。単一のデータベースやコンテキストウィンドウに頼るのではなく、ハイブリッドシステムは高速で揮発性のメモリ(RAMやキャッシュなど)と、低速で永続的なストレージ(ベクトルデータベースや従来のSQL/NoSQLデータベースなど)を戦略的に組み合わせます。
複雑なAIアプリケーションでは、必要とされる情報の量と多様性が単一のメモリコンポーネントの容量を超えることがよくあります。ハイブリッドメモリは、速度と規模のトレードオフを解決します。これにより、モデルは即座に高度に関連性の高いコンテキストにアクセスできると同時に、より深い推論のために膨大な長期的な履歴知識を保持できます。
このシステムは、情報リクエストを最も適切なメモリ層にルーティングすることで機能します。短期的な即時の会話コンテキストは、通常、高速で揮発性のメモリに保持されます。特定の事実や過去のやり取りを検索する場合、システムは過去のデータの埋め込みを保存する専門の知識ベース、多くの場合ベクトルデータベースにクエリを実行します。長期的な構造化データは、検索拡張生成(RAG)パイプラインを介してアクセスされるリレーショナルデータベースに保存されている場合があります。