
Claude Opus 4.6 とは|機能・ベンチマーク・Opus 4.7 との比較
Anthropic が 2026 年 2 月にリリースした Claude Opus 4.6 について、どんな機能を持ち、他の Opus モデルとどこが違うのかを知りたい開発者・利用者向けに、スペック・思考機能・ベンチマーク性能・世代間の機能差を一次情報に基づいて整理する。
Claude Opus 4.6 は 1M コンテキスト・Extended Thinking・Adaptive Thinking を同時に持つ唯一の Opus モデルで、料金は $5/$25。現在はレガシー扱いのため、Anthropic は新規実装に Opus 4.8 を推奨している。
目次 (8)
Claude Opus 4.6 とは — 2026 年 2 月リリースのフラッグシップ
Claude Opus 4.6 は、Anthropic が 2026 年 2 月にリリースしたフラッグシップ言語モデルだ。公式ドキュメントでは「コーディング・長時間タスク・エンタープライズワークフロー向けの高信頼モデル」と位置づけられており、前世代 Opus 4.5(200K コンテキスト)から大幅に拡張された 1M トークンのコンテキストウィンドウが最大の特徴である。
1M コンテキストは約 75 万語・約 340 万 Unicode 文字に相当し、大規模なコードベースや長大なドキュメントをまるごと一度のリクエストで処理できる。同時に、最大出力トークンも 64K から 128K に倍増しており、長文生成が必要な用途でも余裕を持った運用が可能だ。
リリース後の同年 4 月には Opus 4.7 が登場し、現在は Anthropic のレガシーモデルとして引き続き提供されている。新規実装には後継の Opus 4.8 が推奨されているが、特定の思考機能(Extended Thinking)が必要なワークフローでは依然として有力な選択肢になる。
出典: Anthropic — Models overview
主要スペック — モデル ID・コンテキスト窓・出力制限
Anthropic 公式ドキュメントに掲載されている Claude Opus 4.6 の主要スペックを以下にまとめる。
| 項目 | 詳細 |
|---|---|
| Claude API ID | claude-opus-4-6 |
| AWS Bedrock ID | anthropic.claude-opus-4-6-v1 |
| Google Cloud ID | claude-opus-4-6 |
| コンテキストウィンドウ | 1M トークン(約 75 万語 / 約 340 万 Unicode 文字) |
| 最大出力トークン | 128K(Message Batches API + beta ヘッダーで 300K) |
| Extended Thinking | 対応 |
| Adaptive Thinking | 対応 |
| 比較レイテンシ | Moderate(中程度) |
| 信頼知識カットオフ | 2025 年 5 月 |
| 学習データカットオフ | 2025 年 8 月 |
| 標準 API 料金 | 入力 $5 / 出力 $25(百万トークン) |
| Batch API 料金 | 入力 $2.50 / 出力 $12.50(50% 割引) |
Message Batches API では output-300k-2026-03-24 ベータヘッダーを付与することで最大 300K トークンの出力が可能になる。非同期処理を前提としたバッチジョブや、大規模レポート生成などで活用できる。
出典: Anthropic — Models overview
Extended Thinking と Adaptive Thinking — 両機能を備える唯一の Opus
Claude Opus 4.6 の思考機能面での最大の特徴は、Extended Thinking と Adaptive Thinking の両方に対応している点だ。現行 Opus 世代の中でこの組み合わせを持つのは 4.6 だけである。
Extended Thinking は、モデルが内部で段階的な推論ステップを明示的に展開し、複雑な問題を構造的に分解して解決する機能だ。API レスポンスに thinking ブロックが含まれるため、推論プロセスを可視化してデバッグやレビューに活用できる。
Adaptive Thinking は、タスクの複雑さに応じてモデルが自律的に推論の深さを調整する仕組みだ。単純な問いには即座に答え、難解な問題には深い推論を費やすという動的な切り替えが自動で行われるため、エフォートコントロール(低・中・高・最大)との組み合わせで細かい制御が可能になる。
後継の Opus 4.7 では Extended Thinking が廃止され Adaptive Thinking のみの提供になった。そのため、推論過程の可視化が必要なワークフロー、または Extended Thinking の精度が要件となっているシステムでは、Opus 4.6 が現時点で唯一の Opus 系選択肢となる。
出典: Anthropic — Extended thinking / Anthropic — Adaptive thinking
ベンチマーク性能 — Terminal-Bench・GDPval-AA・MRCR
Anthropic がリリース時に公開したベンチマーク結果では、以下の成果が報告されている。
- Terminal-Bench 2.0(長時間コーディングタスク評価): リリース時点で業界最高スコアを記録
- GDPval-AA(知的労働タスク評価): GPT-5.2 を約 144 Elo ポイント上回る成果
- Humanity's Last Exam(複合推論テスト): 業界最高水準の性能
- MRCR v2(8 針・1M コンテキスト版): 76% のスコア(前世代 Sonnet 4.5 は 18.5%)
MRCR は、長大なコンテキスト内に埋め込まれた複数の情報を正確に引き出す能力を測る指標だ。1M コンテキストで 76% というスコアは、「長いから精度が落ちる」という一般的な懸念を払拭する数値として評価されている。
パートナー企業の報告でも実績が確認されている。NBIM(ノルウェー政府系資産運用会社)は 40 件のサイバーセキュリティ調査のうち 38 件で業界最優秀の結果を得た。Rakuten では自律的に 13 件の問題を解決し、12 件を適切なチームに自動的に割り当てることができたという。また Asana では「大規模コードベースのナビゲーション能力が業界最先端」と評価されている。
出典: Anthropic — Introducing Claude Opus 4.6
主要ユースケース — コーディング・大規模ドキュメント・長時間タスク
Claude Opus 4.6 が特に評価されている用途を以下に整理する。
大規模コードベース処理
1M コンテキストを活かし、数十万行規模のリポジトリを一度のリクエストで読み込んで、分析・リファクタリング・バグ検出を実行できる。GitHub での複雑なマルチステップコーディング作業でも成果が確認されている。
長時間・多段階タスク
コンテキスト圧縮機能により、長時間の作業セッション全体を通じて記憶を維持しながら継続実行できる。Notion は「複雑なリクエストを段階的に処理して洗練された成果物を生成できる」と報告している。
エンタープライズ調査・分析
サイバーセキュリティ調査、大量文書のレビュー、コンプライアンスチェックなど、正確性と長い入力コンテキストの両方が求められる業務に向いている。NBIM の 38/40 というサイバーセキュリティ調査での成果は、企業ユースケースでの信頼性を示している。
Excel / PowerPoint 統合
リリース時点では、Excel での構造化データへの推論・複数ステップの変更対応、PowerPoint でのデザイン自動適応がリサーチプレビューとして提供されていた。
Opus 4.5 / 4.7 / 4.8 との比較 — 世代間の機能差
Opus 世代の機能変化を一覧で整理する。
| 機能 | Opus 4.5 | Opus 4.6 | Opus 4.7 | Opus 4.8 |
|---|---|---|---|---|
| コンテキスト | 200K | 1M | 1M | 1M |
| 最大出力 | 64K | 128K | 128K | 128K |
| Extended Thinking | ✓ | ✓ | ✗ | ✗ |
| Adaptive Thinking | ✗ | ✓ | ✓ | ✓ |
| トークナイザー世代 | 旧 | 旧 | 新(+約 30%) | 新(+約 30%) |
| 標準料金(入力/出力) | $5/$25 | $5/$25 | $5/$25 | $5/$25 |
Opus 4.6 が他の世代と最も異なる点は Extended Thinking と Adaptive Thinking の両立だ。Opus 4.5 は Adaptive Thinking に非対応で、Opus 4.7 以降は Extended Thinking が廃止されている。
また、Opus 4.7 から新トークナイザーが導入されており、同一テキストで最大約 30% 多くのトークンを消費する。料金は変わらないものの、トークン消費量が増えるため実質コストが上がるケースがある。Opus 4.6 は旧トークナイザーのためこの影響を受けず、大量トークン処理を行うワークロードでのコスト試算は旧世代の方が有利になる場合がある。
出典: Anthropic — Migrating to Claude Opus 4.7
利用できるプラットフォーム
Claude Opus 4.6 は以下のプラットフォームで利用できる。
- Claude API — モデル ID
claude-opus-4-6(Anthropic コンソールから API キー取得) - claude.ai — Pro プラン以上のサブスクリプションでレガシーモデルとして選択可能
- AWS Bedrock —
anthropic.claude-opus-4-6-v1(Messages API エンドポイント経由) - Google Cloud / Vertex AI —
claude-opus-4-6(グローバル・マルチリージョン・リージョナルの 3 エンドポイント) - Microsoft Foundry —
claude-opus-4-6(コンテキストウィンドウは 200K に制限) - Claude Platform on AWS —
claude-opus-4-6(Bedrock とは異なる Anthropic 直接エンドポイント)
Microsoft Foundry のみコンテキストウィンドウが 200K に制限されている点に注意が必要だ。1M コンテキストを活用したい場合は Claude API / Bedrock / Vertex AI のいずれかを使う必要がある。
出典: Anthropic — Models overview
Claude Opus 4.6 を今使うべきか — 移行の判断軸
2026 年 6 月時点では、Anthropic はレガシーモデルとして Opus 4.6 を引き続き提供しているが、新規実装には最新の Opus 4.8 への移行を推奨している。どちらを選ぶかは、以下の判断軸が参考になる。
Opus 4.6 を維持すべきケース:
- Extended Thinking を使用しているワークフローがある
- Opus 4.7 以降のトークナイザー変更(+約 30%)がコスト上問題になる
- 既存の統合が安定しており変更コストが高い
Opus 4.8 への移行を検討すべきケース:
- 新規プロジェクトを立ち上げる
- 最新のコーディング・推論性能を必要とする
- Adaptive Thinking による動的制御で十分なワークロードである
料金は Opus 4.5〜4.8 すべて $5/$25 と同一のため、移行の費用障壁はない。ただし、Opus 4.6 から 4.7 以降に切り替える際はトークナイザー変更があるため、実際のトークン消費量を計測してから本番移行することを推奨する。