用語解説
コンテキストウィンドウとは、LLMが一度の処理で参照できるテキストの最大量をトークン数で表した制限値です。ウィンドウを超えた情報は処理対象から外れます。
主要モデルのコンテキストウィンドウは急速に拡張されています。
- GPT-3.5:4,096トークン(初期)→ 16K
- GPT-4o:128,000トークン
- Claude 3.7:200,000トークン(約15万語相当)
- Gemini 1.5 Pro:1,000,000トークン
この拡張により、長文の契約書・コードベース全体・長時間の会話履歴などを一度に処理できるようになりました。ただし大きなウィンドウほどAPIコストが高くなる点に注意が必要です。
どんな場面で活用するか
- 長文書の全文分析:数万字に及ぶ契約書・法律文書を丸ごと処理して要点を抽出。
- 長期カスタマーサポート:会話履歴全体を維持した継続的なチャット対応。
- 大規模コードレビュー:複数ファイルにまたがるコードの分析・デバッグ。
- 大量フィードバック分析:数千件の顧客レビューを一括で傾向分析。
よくある誤解
❌ 誤解1:大きなウィンドウほど常に良い
大量の情報を詰め込むと中央部分の情報が見落とされやすい「lost in the middle」問題があります。必要な情報に絞って入力する設計の方が、精度・コストの両面で優れることがあります。
❌ 誤解2:コンテキストウィンドウ=長期記憶
LLMはコンテキストウィンドウ内の情報しか参照できず、会話セッションをまたいだ記憶は持ちません。長期的な情報保持にはエージェントメモリやデータベースとの統合が必要です。
判断のヒント
Creative Drive AIエージェントプラン
コンテンツマーケティングを、AIが月最大100記事・全自動で実行
競合データ×顧客行動データをリアルタイムで掛け合わせ、担当者の工数ほぼゼロで問い合わせを増やし続けます。ChatGPT・Perplexityへの引用最適化(AIO/LLMO)にも対応。
AIエージェントプランを詳しく見る