
Bedrock Claude 料金|Opus・Sonnet・Haiku の単価とコスト削減
Amazon Bedrock で Claude を呼び出すときの料金を、Opus 4.x / Sonnet 4.6 / Haiku 4.5 のモデル別単価から、global と regional の差、Prompt Caching、Batch API の 50% 割引、Claude Platform on AWS との違いまで一気に整理しました。請求書を見てから慌てないために、コストを最小化する 4 つの実践則も併せて解説します。
Bedrock 経由の Claude 料金は、最新世代では Anthropic 直契約と同水準に整っています。Sonnet 4.6 は入力 $3 / 出力 $15、Haiku 4.5 は入力 $1 / 出力 $5、Opus 4.7 は入力 $5 / 出力 $25(いずれも 1M tokens あたり)が基準です。旧世代の Claude 3.5 Sonnet は Bedrock 上で $6 / $30 と高く、最新モデルへの移行だけでコストが半減するケースもあります。
Claude Sonnet 4.5 / Haiku 4.5 / Opus 4.5 以降、Bedrock は global endpoint と regional endpoint の 2 種類を提供し、regional は global より 10% 高い 設計です。データレジデンシー要件が無いなら global を選ぶのが基本で、東京リージョン固定が必須でなければ約 1 割の節約になります。
Prompt Caching(5 分書き込み 1.25 倍・読み出し 0.1 倍) と Batch API(入出力ともに 50% 割引) が、Bedrock でも有効な王道のコスト削減手段です。会話履歴や長大なシステムプロンプトを抱えるアプリでは Prompt Caching、夜間バッチには Batch API、と用途で使い分けるとコストが大きく下がります。
目次 (12)
- Bedrock Claude 料金の基本構造 — 単価は 4 階層で決まる
- 旧世代と最新世代でモデル単価が大きく違う
- モデル別の単価早見表 — Opus 4.x / Sonnet 4.6 / Haiku 4.5
- Sonnet 4.6 が本番標準、Haiku 4.5 はバッチ向け
- Global と Regional の選択 — 10% の単価差を見落とさない
- regional の 10% premium は input / output 両方に乗る
- Prompt Caching で書き込み 1.25 倍・読み出し 0.1 倍
- 自動キャッシュと明示的キャッシュの使い分け
- Batch API で入力・出力ともに 50% オフ
- Claude Platform on AWS との違い — CCU 単位の新方式
- コスト試算の実例 — 顧客サポート 1 万件で約 $37
- Bedrock Claude 料金を最小化する 4 つの実践則
Bedrock Claude 料金の基本構造 — 単価は 4 階層で決まる
Amazon Bedrock 上の Claude 料金は、(1) モデル別の入力単価、(2) モデル別の出力単価、(3) endpoint 種別(global / regional)、(4) Prompt Caching と Batch の割引、の 4 階層 で決まります。AWS の請求書では「Bedrock — Anthropic Claude」として 1 行で計上されますが、内訳を分解しないと節約できる場所が見えません。
課金単位は 1M tokens(100 万トークン) で、英語で約 75 万単語、日本語混在でも数十万字に相当します。短い問い合わせを 1 件処理するだけなら 1 件あたり数セントですが、長文資料を毎回投入するエージェント連携では月次で数千ドル規模になることもあり、構造を理解しておかないと「思ったより高い」と請求書に驚きます。
出典: Amazon Bedrock Pricing(英語版)(参照: 2026-05-29)、Anthropic 公式 Pricing(参照: 2026-05-29)
旧世代と最新世代でモデル単価が大きく違う
Bedrock 上では Claude 3.5 Sonnet が現在も提供されていますが、単価は 入力 $6 / 出力 $30 per 1M tokens と、最新の Sonnet 4.6($3 / $15)の 2 倍 です。3.5 系を使い続けている本番システムは、Sonnet 4.6 や Haiku 4.5 に切り替えるだけで品質を落とさずコストが半減します。
最新世代と旧世代では tokenizer も入れ替わっており、Opus 4.7 以降は 同じテキストでもトークン数が最大 35% 増える という公式注記もあります。単価が下がっても出力長次第ではトータルコストが想定通りに減らないことがあるため、移行時は一度ベンチマークで実測することを推奨します。
モデル別の単価早見表 — Opus 4.x / Sonnet 4.6 / Haiku 4.5
本セクションの要点を以下に整理します。
| モデル | 入力(per 1M tokens) | 出力(per 1M tokens) | コンテキスト | 主な用途 |
|---|---|---|---|---|
| Claude Opus 4.7 | $5 | $25 | 1M tokens | 複雑な推論・長尺コーディング |
| Claude Opus 4.6 | $5 | $25 | 1M tokens | 高難度推論 |
| Claude Sonnet 4.6 | $3 | $15 | 1M tokens | 本番ワークロード標準 |
| Claude Sonnet 4.5 | $3 | $15 | 200k tokens | コスト効率重視 |
| Claude Haiku 4.5 | $1 | $5 | 200k tokens | 大量・低遅延・分類 |
| Claude Haiku 3.5(レガシー) | $0.80 | $4 | 200k tokens | コスト最優先 |
| Claude Opus 4.1(レガシー) | $15 | $75 | 200k tokens | 旧世代・高単価 |
| Claude 3.5 Sonnet(旧世代) | $6 | $30 | 200k tokens | 旧 Bedrock 価格帯 |
出典: Anthropic 公式 Pricing(参照: 2026-05-29)、Claude Models overview(参照: 2026-05-29)
Bedrock 経由の最新 4.x 系モデルは、Anthropic API 直契約とほぼ同水準の単価で提供されています。Opus 4.1 は $15 / $75 と Opus 4.6 / 4.7 の 3 倍 の単価で、レガシー扱いです。新規開発で Opus 系を使うなら 4.6 以降を選ぶことで単価面のメリットを取り切れます。
Sonnet 4.6 が本番標準、Haiku 4.5 はバッチ向け
Sonnet 4.6 は 入力 $3 / 出力 $15 で、Opus の 1/5、Haiku の 3 倍という中間ポジションです。コード生成・要約・RAG 応答などの本番ワークロードでは、Sonnet 4.6 を基準にして Opus / Haiku を必要に応じて使い分けるのが最もコスト効率の良い設計になります。
Haiku 4.5 は入力 $1 / 出力 $5 と Sonnet の 1/3 の単価で、分類・抽出・短い応答生成・大量バッチに適しています。公式の試算では 顧客サポートチケット 1 万件を Haiku 4.5 で処理すると約 $37 と算出されており、メール分類や FAQ 一次応答などはほぼ Haiku で賄えます。
Global と Regional の選択 — 10% の単価差を見落とさない
Claude Sonnet 4.5 / Haiku 4.5 / Opus 4.5 以降のモデルでは、Bedrock の endpoint が 2 種類に分かれました。global endpoint は世界中の AWS リージョンで動的にルーティングされ可用性を最大化する標準オプションで、regional endpoint は特定の地理リージョン内に推論データを閉じ込められる代わりに global より 10% 高い という設計です。
東京リージョン固定が必須かどうかをまず確認してください。データレジデンシー要件が「日本国内に閉じる」レベルで厳しくない場合、global endpoint を選ぶだけで約 1 割の節約になります。逆に、金融・医療・公的機関などで「特定リージョンへの routing を契約上保証する必要がある」場合は、regional の 10% プレミアムは妥当な保険コストです。
regional の 10% premium は input / output 両方に乗る
10% プレミアムは 入力トークン・出力トークン・キャッシュ書き込み・キャッシュ読み出しのすべて に乗ります。Sonnet 4.6 の regional endpoint は実質 入力 $3.30 / 出力 $16.50 相当になる計算で、月間トークン消費量に応じて影響額を試算しておくと、AWS の請求書と乖離しません。
旧世代モデル(Sonnet 4 / Opus 4 以前)は global / regional の区別がなく、従来の単一価格のまま提供されています。混在環境では、どのモデルがどの endpoint かを台帳化しておかないと、月次の単価分析が破綻するので注意してください。
出典: Anthropic Pricing — Cloud platform pricing(参照: 2026-05-29)
Prompt Caching で書き込み 1.25 倍・読み出し 0.1 倍
Prompt Caching は、長大なシステムプロンプトや会話履歴を再利用するときに、入力単価を大幅に下げられる仕組みです。Bedrock 経由でも有効で、料金体系は以下の倍率で適用されます。
| 操作 | 基準入力単価に対する倍率 | 有効期間 |
|---|---|---|
| 5 分キャッシュ書き込み | 1.25 倍 | 5 分 |
| 1 時間キャッシュ書き込み | 2 倍 | 1 時間 |
| キャッシュ読み出し(ヒット) | 0.1 倍 | 書き込みと同じ |
Sonnet 4.6 で計算すると、5 分キャッシュ書き込みは 入力 $3.75 / 1M tokens、キャッシュ読み出しは $0.30 / 1M tokens です。1 回でも再読み出しがあれば 5 分キャッシュは元が取れ、2 回読み出されれば 1 時間キャッシュも黒字 になります。RAG の参照ドキュメント、長文の指示プロンプト、会話履歴を頻繁に再利用するアプリでは、必ず有効化すべきです。
自動キャッシュと明示的キャッシュの使い分け
キャッシュの設定方法は 2 つあります。
- 自動キャッシュ: リクエストのトップレベルに
cache_controlを 1 つ付けるだけで、システムがキャッシュ境界を自動管理します。ほとんどのユースケースはこちらで十分です。 - 明示的なキャッシュ境界: 個別のコンテンツブロックに
cache_controlを付けることで、何をキャッシュするかを細かく制御できます。長いシステムプロンプトと頻繁に変わるユーザー入力を分離したいときに使います。
Prompt Caching の倍率は Batch API 割引やデータレジデンシー倍率と 積算 されます。Batch API + Prompt Caching を組み合わせると、最も安価な構成では基準単価の数%まで圧縮できる場面もあります。
出典: Anthropic Pricing — Prompt caching(参照: 2026-05-29)
Batch API で入力・出力ともに 50% オフ
Batch API は、非同期でリクエストをまとめて処理する仕組みで、入力・出力ともに 50% 割引 が適用されます。Bedrock 上でも同等の割引が用意されており、夜間ジョブや大量データ前処理など「即時応答が不要」な処理は、Batch に流すだけでコストが半減します。
| モデル | Batch 入力 | Batch 出力 |
|---|---|---|
| Claude Opus 4.7 | $2.50 | $12.50 |
| Claude Sonnet 4.6 | $1.50 | $7.50 |
| Claude Haiku 4.5 | $0.50 | $2.50 |
(per 1M tokens、出典: Anthropic Pricing — Batch processing、参照: 2026-05-29)
Haiku 4.5 を Batch で使えば、入力 $0.50 / 出力 $2.50 per 1M tokens という極めて低い単価で大量処理が可能です。10 万件のメール分類、検索インデックス用の要約生成、ログの構造化など、リアルタイム性を要求しない処理は Batch に寄せるのがコスト戦略の基本になります。
ただし Batch API は 応答が最大 24 時間遅れる 場合があるため、同期 API と組み合わせる設計が前提です。Fast mode との併用はできないので、低遅延が必要な処理は同期 API、それ以外を Batch に分ける運用が現実解です。
Claude Platform on AWS との違い — CCU 単位の新方式
Bedrock とは別に、Anthropic が直接提供する Claude Platform on AWS も AWS Marketplace 経由で利用できます。こちらは CCU(Claude Consumption Units) という独自単位で請求され、$0.01 per CCU 固定です。トークン消費量を Anthropic 直契約の料金で USD 換算し、それを CCU に変換して AWS Marketplace に時間単位でメータリングする仕組みです。
| 項目 | Amazon Bedrock | Claude Platform on AWS |
|---|---|---|
| 課金単位 | トークン(per 1M) | CCU($0.01 / CCU 固定) |
| 単価の根拠 | Bedrock 独自テーブル | Anthropic 直契約と同等 |
| 請求書の見え方 | モデル別の行 | 単一 CCU 行 |
| 利用可能機能 | Bedrock 機能群(Guardrails / Knowledge Bases 等) | Anthropic ネイティブ機能(Memory / Files / Web 検索) |
| プライベートオファー | Bedrock 契約 | Claude Platform 契約(個別) |
出典: Anthropic Pricing — Claude Platform on AWS pricing(参照: 2026-05-29)
データを AWS 統制下に閉じ込めたい組織は Bedrock、Anthropic ネイティブ機能(Memory・Files API・Web 検索など)を使いたい組織は Claude Platform on AWS、という棲み分けが原則です。既存の Bedrock プライベートオファーがある組織が Claude Platform on AWS を併用する場合、割引の遡及適用ができない ため、契約タイミングをアカウント担当者と擦り合わせる必要があります。
コスト試算の実例 — 顧客サポート 1 万件で約 $37
実際のコスト感を掴むため、公式ドキュメントの試算例を引用します。
- 顧客サポートチケット 10,000 件
- 1 件あたり平均 ~3,700 tokens
- Claude Haiku 4.5(入力 $1 / 出力 $5 per 1M tokens)
- 合計: 約 $37(1 万件あたり)
つまり 1 件あたり約 0.4 セントです。同じ処理を Sonnet 4.6 で行うと約 3 倍、Opus 4.7 だと約 5 倍の単価になる計算ですが、品質要件次第で十分元が取れます。
Claude Managed Agents を使う場合は、トークン課金に加えて session runtime $0.08 per session-hour が加算されます。running 状態の時間だけが課金対象で、idle や rescheduling 中は無課金です。エージェント連携の常時稼働が必要な業務では、この session runtime が累積コストの主成分になる場合もあるため、idle 化を積極的に設計に組み込むのが鉄則です。
Bedrock Claude 料金を最小化する 4 つの実践則
最後に、Bedrock 上の Claude 料金を効果的に下げる 4 つの原則を整理します。
- モデル階層を用途別に分ける — 分類・抽出は Haiku 4.5、本番ワークロードは Sonnet 4.6、高難度推論のみ Opus。1 モデルで全部済ませようとすると確実に高くつきます。
- Prompt Caching を常時有効化 — システムプロンプトと会話履歴のキャッシュは、ヒット率が 1 回でもあれば回収可能。RAG・チャットボット・コードアシスタントでは特に効果が大きいです。
- Batch API に夜間処理を寄せる — 即時応答が不要な処理は Batch で 50% 割引。10 万件規模では月次数千ドル単位の差になります。
- global endpoint を基準にする — データレジデンシー要件が無いなら 10% の節約。regional は契約上必要な場合のみに限定するのが現実的です。
これらを組み合わせると、たとえば「Sonnet 4.6 + Prompt Caching + global endpoint + 夜間 Batch」の構成で、3.5 系 + regional 単体運用と比較して トータルコストが 1/4 以下 になるケースも珍しくありません。請求書が想定外に膨らんだら、まずこの 4 軸のどこが抜けているかを点検してください。
出典: Amazon Bedrock Pricing(参照: 2026-05-29)、Anthropic 公式 Pricing(参照: 2026-05-29)、Claude Models overview(参照: 2026-05-29)