
Claude Sonnet 4.6 とは|スペック・できること・Opus との違い
Claude Sonnet 4.6 は Anthropic が「速度と知性の最良の組み合わせ」と定義する中核モデルです。モデル ID は claude-sonnet-4-6、コンテキスト窓は 1M トークン(約 340 万 Unicode 文字)、最大出力は 64K トークン(Message Batches API + ベータヘッダーで最大 300K)。Extended Thinking と Adaptive Thinking の両機能を備えます。
API 料金は入力 $3/MTok・出力 $15/MTok で、上位の Opus 4.8($5/$25)の 60% の価格です。Claude API・AWS Bedrock・Google Vertex AI・Microsoft Foundry の 4 プラットフォームで提供されており、本番ワークロードの主力モデルとして広く利用されています。
現行の標準 3 モデル(Opus 4.8 / Sonnet 4.6 / Haiku 4.5)の中で、Extended Thinking と Adaptive Thinking を同時に備えるのは Sonnet 4.6 のみです。
目次 (8)
Claude Sonnet 4.6 とは — 公式ポジションとモデル ID
Anthropic の公式ドキュメントでは、Claude Sonnet 4.6 を「速度と知性の最良の組み合わせ(the best combination of speed and intelligence)」と定義しています。Opus シリーズが複雑な推論や高度な自律的コーディングを担うのに対し、Sonnet は本番ワークロードを高速かつ高精度で処理するポジションです。
API で使うモデル ID は claude-sonnet-4-6 です。Claude 4.6 世代以降は日付サフィックスなしのエイリアス型 ID が採用されており、これはバージョン固定のスナップショットです。自動的に次世代バージョンへ切り替わるポインタではないため、モデル ID を変えずに同じ挙動を維持できます。
主要スペック一覧
公式ドキュメントに記載されている Sonnet 4.6 の仕様をまとめます。
| 項目 | Claude Sonnet 4.6 |
|---|---|
| モデル ID(Claude API) | claude-sonnet-4-6 |
| コンテキスト窓 | 1M トークン(約 75 万語・約 340 万 Unicode 文字) |
| 最大出力(通常) | 64,000 トークン |
| 最大出力(Batch API + ベータヘッダー) | 300,000 トークン |
| 信頼可能な知識カットオフ | 2025 年 8 月 |
| 学習データカットオフ | 2026 年 1 月 |
| 応答速度 | Fast |
| Extended Thinking | 対応 |
| Adaptive Thinking | 対応 |
| Priority Tier | 対応 |
コンテキスト窓 1M トークンは「約 340 万 Unicode 文字」に相当します。日本語の場合、1 文字あたり約 1〜1.5 トークンなので、実質的に日本語で約 67〜100 万文字を一度に処理できる計算になります。文庫本 1 冊をおよそ 10〜15 万文字とすると、単行本 7〜10 冊分の文量をまとめてコンテキストへ収められます。
Extended Thinking と Adaptive Thinking の違い
Sonnet 4.6 が対応する「思考モード」は 2 種類あります。どちらも推論精度に関わる機能ですが、動作の仕組みが異なります。
Extended Thinking(拡張思考)は、モデルが回答を生成する前に思考過程を明示的に出力するモードです。API では thinking パラメーターを有効にして呼び出します。数学の証明・コードのデバッグ・多段階の論理推論など「解法の透明性」が求められる場面で効果を発揮します。
Adaptive Thinking(適応的思考)は、問題の難易度に応じて内部の熟考量を自動調整する機能です。シンプルな質問には素早く答え、複雑な問題では自動的に時間をかけて深く考えます。ユーザーが明示的に有効化する操作は不要で、常時有効な状態で動作します。
現行の標準 3 モデルの機能対応状況は次のとおりです。
| モデル | Extended Thinking | Adaptive Thinking |
|---|---|---|
| Opus 4.8 | なし | あり |
| Sonnet 4.6 | あり | あり |
| Haiku 4.5 | あり | なし |
この表が示すように、Sonnet 4.6 は両機能を同時に備える唯一の標準モデルです。拡張思考が必要で、かつコストを Opus 4.8 より抑えたい場合は Sonnet 4.6 一択になります。
1M トークンのコンテキスト窓で何が変わるか
Sonnet 4.5 以前の世代はコンテキスト窓が 200K トークンでした。Sonnet 4.6 の 1M トークンは旧世代の 5 倍の規模です。
この拡大が実務に直結するシーンには次のようなものがあります。
- 大規模なコードベース(複数ファイルの合計)を 1 回のプロンプトで渡してバグ調査や仕様確認を行う
- 数百ページの PDF・法律文書・技術仕様書を一括でコンテキストに含める
- 長期にわたる会話履歴を保持したまま追加の質問を継続する
- RAG を使わず大量のドキュメントをそのままコンテキストへ含める実装を検証する
- 複数ファイルの差分を同時に渡して包括的なコードレビューをさせる
なお、Sonnet 4.6 の 1M トークン対応は、2026 年 4 月 30 日に廃止された Sonnet 4.5 のベータヘッダー「context-1m-2025-08-07」とは別物です。Sonnet 4.6 ではベータヘッダー不要で 1M トークンを標準利用できます。
Opus 4.8・Haiku 4.5 との比較
3 モデルのスペックを横並びで比較します。
| 比較項目 | Opus 4.8 | Sonnet 4.6 | Haiku 4.5 |
|---|---|---|---|
| 推奨用途 | 複雑推論・高度な自律作業 | 本番ワークロード全般 | 高速処理・コスト重視 |
| コンテキスト窓 | 1M トークン | 1M トークン | 200K トークン |
| 最大出力(通常) | 128K トークン | 64K トークン | 64K トークン |
| Extended Thinking | なし | あり | あり |
| Adaptive Thinking | あり | あり | なし |
| 応答速度 | Moderate | Fast | Fastest |
| API 料金(入力) | $5/MTok | $3/MTok | $1/MTok |
| API 料金(出力) | $25/MTok | $15/MTok | $5/MTok |
Sonnet 4.6 の API 料金は Opus 4.8 の 60% です。ただし Opus 4.8 の最大出力は 128K トークン(Sonnet 4.6 の 2 倍)あります。1 回の応答で膨大な長文を生成したい場合や、フロンティアの精度を求める複雑なタスクでは Opus 4.8 に優位性があります。
Haiku 4.5 はさらに安価・高速ですが、コンテキスト窓が 200K トークンに限定され、Adaptive Thinking にも対応しません。単純な分類・要約・短い対話で速度とコストを最優先する場面向けです。
Batch API と 300K 出力ベータ
通常の Messages API では Sonnet 4.6 の最大出力は 64K トークンです。しかし Message Batches API でベータヘッダー output-300k-2026-03-24 を指定すると、最大 300K トークンの出力が可能になります。長文レポートや詳細なコード生成をバッチで大量処理する用途で活用できます。
Batch API には料金の優遇もあり、標準単価から 50% 引き(入力 $1.5/MTok・出力 $7.5/MTok)で利用できます。即時応答が不要な大量処理タスクには、Batch API の利用がコストを最も抑えられる方法です。
また、prompt caching を併用することでさらに料金を抑えられます。cache read のヒット時は $0.30/MTok(標準の 10%)まで下がります。Batch API と prompt caching の割引は重ねて適用できるため、同じ system prompt を繰り返し送るバッチ処理では実質的なコストが大幅に低減します。
利用できるプラットフォーム
Sonnet 4.6 は以下の 4 プラットフォームから利用できます。
| プラットフォーム | モデル ID |
|---|---|
| Claude API | claude-sonnet-4-6 |
| AWS Bedrock | anthropic.claude-sonnet-4-6 |
| Google Vertex AI | claude-sonnet-4-6 |
| Microsoft Foundry | claude-sonnet-4-6 |
AWS Bedrock では、グローバルエンドポイント(最大可用性のための動的ルーティング)とリージョナルエンドポイント(特定地域へのデータルーティング保証)の 2 種類が選択できます。コンプライアンス要件でデータの通過経路を制限する必要がある場合はリージョナルエンドポイントを選んでください。
Google Vertex AI ではグローバル・マルチリージョン・リージョナルの 3 種類が利用できます。Vertex AI での詳細は「Vertex AI で Claude 4.6 を使う」を参照してください。
Microsoft Foundry では Claude API と同じモデル ID を使います。ただし、Foundry では Opus 4.8 のコンテキスト窓が 200K トークンに制限されます(Sonnet 4.6 の制限は特に記載なし)。
Sonnet 4.6 を選ぶべきシーンと料金の目安
Anthropic の推奨をもとにした、モデル選択の判断基準をまとめます。
- Sonnet 4.6 が最適なシーン: 本番 API への組み込み・大量処理・速度と精度のバランスが重要なタスク全般、1M トークンのコンテキストが必要で拡張思考も使いたい場面
- Opus 4.8 を選ぶシーン: フロンティアの精度が求められる複雑な推論、128K トークン超の長文生成、高度な自律作業
- Haiku 4.5 を選ぶシーン: シンプルな分類・要約・短い対話、速度またはコストの最優先、200K 以内のコンテキストで完結するタスク
料金は API 経由で入力 $3/MTok・出力 $15/MTok(税別 USD)が基本単価です。Claude.ai のサブスクリプション(Pro $20/月・Max $100/月〜・Team $25/席・月)からも利用できます。料金の詳細や各プランの比較は「Claude Sonnet の値段はいくら」で解説しています。