コンテキストウィンドウ
コンテキストウィンドウとは、大規模言語モデル(LLM)が単一の対話中に処理または「記憶」できる最大量の入力テキスト(プロンプト)と出力テキスト(補完)を指します。この容量はトークンで測定され、トークンは概ね単語またはサブワード単位に相当します。
コンテキストウィンドウのサイズは、LLMが処理できるタスクの複雑さと範囲を直接決定します。より大きなウィンドウは、モデルがより長い会話で一貫性を維持し、広範なドキュメントを分析し、全体的な流れを見失うことなく複雑な入力の以前の部分を参照することを可能にします。
ほとんどの最新のLLMを支えるTransformerベースのモデルは、この定義されたトークン制限内で情報を順次処理します。入力がコンテキストウィンドウを超えると、モデルは最も古い情報を切り捨てる必要があり、実質的に会話やドキュメントの冒頭部分を「忘れて」しまいます。