モデルベースポリシー
モデルベースポリシーとは、人工知能システム内の、その環境の内部表現(「モデル」)に基づいてシステムがどのように行動するか、またはどのように意思決定を行うかを指示する一連のルール、あるいは学習された関数を指します。単に反応的なルールや事前にプログラムされたロジックに頼るのではなく、システムは学習したモデルを使用して将来の結果を予測し、最適なアクションを選択します。
ロボティクス、自動取引、大規模なリソース管理などの複雑で動的な環境では、単純な反応的ポリシーは結果を予測できないため機能しません。モデルベースポリシーは、AIエージェントが行動を決定する前に内部で潜在的なシナリオをシミュレーションすることを可能にし、著しくより堅牢で、積極的で、効率的な動作につながります。
このプロセスは一般的に3つの段階を含みます。
この概念は、強化学習(RL)、特にモデルベースRLと密接に関連しています。また、計画アルゴリズムや状態推定技術とも交差します。