
要約 — このレッスンの要点
- コンテキストウィンドウとは「Claude が一度に読める最大テキスト量」のこと。
- Claude の API モデルは最大 1M トークン(約 75 万〜100 万語相当)のウィンドウを持つ。
- 長い PDF・コードベース・会議録を丸ごと貼り付けて質問できるのが強みだ。
- Extended Thinking は回答前に内部で深く考えるモード。複雑な推論タスクで特に有効。
- ウィンドウの後半部分ほど Claude の注意が薄れる傾向があるため、重要情報は冒頭か末尾に置く。
コンテキストウィンドウとは
大規模言語モデル(LLM)は「その会話の中で見えているテキスト全体」を読んで回答を生成します。 この「一度に処理できる最大量」を コンテキストウィンドウ と呼びます。 単位はトークン(token)で、日本語のひらがな・カタカナ 1 文字はおおむね 1〜2 トークン、 英単語は 1 語が 1〜2 トークン程度です。
会話が長くなるにつれて「プロンプト + 会話履歴 + 返答」の合計がウィンドウを圧迫します。 ウィンドウを超えると、古い会話部分が見えなくなります。
Claude のウィンドウ規模
Claude のモデルは、他の主要 LLM と比べて大きなコンテキストウィンドウを持つことで知られています。
- claude.ai(Web UI): 標準的な会話では 200K トークン(約 15 万文字)が目安。
- API 経由: 最大 1M トークンのウィンドウを持つモデルが利用可能(出典: Anthropic 公式ドキュメント)。
- 1M トークンは A4 用紙約 750 枚分の英語テキスト、または文庫本 4〜5 冊分に相当します。
長文読解への活用
大きなコンテキストウィンドウは以下のようなタスクで威力を発揮します。
- PDF の丸ごと要約: 100 ページを超える報告書・論文をそのまま貼り付けて要約・Q&A ができる。
- コードベースの一括レビュー: 複数ファイルをまとめて貼り付けて、全体の設計を分析させる。
- 会議録・議事録の分析: 数時間分の書き起こしを渡して「誰が何を決めたか」を抽出。
- 長編の一貫性チェック: 小説・マニュアルの全文を通して矛盾を探させる。
効果的な配置のコツ
研究によると、LLM は ウィンドウの中央部分の情報を失念しやすい傾向があります。 これを「Lost in the Middle」問題と呼びます。
実用上の対策:
- 最重要な指示・制約はプロンプトの 冒頭または末尾 に置く。
- 長い資料を貼った後に「この資料をもとに〜してください」と末尾で再度タスクを明示する。
- 複数の資料を渡す場合は、優先度の高いものを最後に置く。
Extended Thinking
Extended Thinking は、Claude が回答を生成する前に内部で長い思考プロセスを走らせるモードです。 通常の応答より時間がかかりますが、以下のようなタスクで精度が向上します。
- 数学・論理パズルなど段階的な推論が必要な問題
- 複数の制約条件を同時に満たす必要がある計画立案
- コードのバグ特定とリファクタリング提案
API では thinking パラメータで有効化できます。
claude.ai の Web UI では特定のモデル・設定で自動的に有効になる場合があります。
ウィンドウとトークン料金の関係
API を利用する場合、コンテキストウィンドウのトークン数がそのまま料金に影響します。 大量のテキストを毎回渡すと、コストが急増します。 「Prompt Caching」という仕組みを使うと、繰り返し使う長文の処理コストを削減できます。 これは Level 5「API / SDK」で詳しく扱います。