コンテンツベースフィルタリングは、レコメンデーションシステムモジュール内で、明示的に定義されたアイテムの特徴を活用して、ユーザーの興味を予測する機能です。この機能は、主要なコンピューティング処理の一部として、協調フィルタリングデータを使用せずに、クエリアイテムと候補となるアイテム群との間のベクトル類似度を計算します。特に、過去のインタラクションデータが少ないコールドスタートの状況において、このシステムは、確率的なユーザーモデリングではなく、決定論的な属性マッチングによって、迅速に適切な情報を提示することができます。
エンジンは、テキスト埋め込み、カテゴリタグ、および数値属性を含むアイテムのメタデータから、高次元の特徴ベクトルを抽出します。
コサイン距離やユークリッド距離などの類似度指標は、対象アイテムとカタログ内のアイテムとの関連性を定量化します。
ランキングアルゴリズムは、閾値スコアに基づいて候補者をフィルタリングし、意味的に類似したアイテムの厳選されたリストを提供します。
対象アイテムの属性定義に基づいて、特徴抽出モジュールを初期化します。
候補者リポジトリ内のすべてのアイテムに対して、埋め込みベクトルを計算します。
クエリベクトルと、各候補アイテムベクトルとの類似度スコアを算出します。
ランキング閾値を適用し、類似度スコアが最も高い上位N個のアイテムを選択します。
非構造化のアイテムデータを自動的に解析し、数値データとして構造化することで、アルゴリズムによる処理を可能にします。
クエリベクトルと、格納されている候補アイテムの埋め込み表現との間の距離指標を、リアルタイムで算出します。
予測された関連性確率に基づいて、重み付けスコアリングを適用して注文の推奨を行います。