Claude 高速モード|2.5倍速の使い方と料金・サブスク扱い

Claude 高速モード|2.5倍速の使い方と料金・サブスク扱い

Claude 高速モード|2.5倍速の使い方と料金・サブスク扱い

「Claude の出力が遅い」「もっと速く返してほしい」——そう感じたときの公式の答えが 高速モード(Fast Mode) です。同じモデルを高速な構成で動かし、出力を最大 2.5 倍まで引き上げる仕組みで、2026 年 2 月にリサーチプレビューとして提供が始まりました。本記事では対応モデル・使い方・料金・サブスクとの関係まで、Anthropic の一次情報だけを根拠に整理します。

結論powered by Claude
![Claude 高速モード|2.5倍速の使い方と料金・サブスク扱い](/assets/generated/placeholder-claude-speed-hero.jpg)
目次 (10)

結論早見 — 「Claude を速くする」= 高速モードで出力 2.5 倍

まず要点を表でまとめます。

項目 内容
速くなる対象 出力トークン/秒(OTPS)を最大 2.5 倍
対応モデル Claude Opus 4.8 / 4.7 / 4.6 のみ
品質 同じモデルの重み・挙動。知能や機能の低下なし
有効化(Claude Code) /fast コマンド
有効化(API) speed: "fast" パラメータ
料金(Opus 4.8) 入力 $10・出力 $50 / 100万トークン
サブスク Pro/Max でも使用量クレジットへ直接課金
位置づけ リサーチプレビュー(仕様・価格は変更あり)

ポイントは、速くなるのは「1 秒あたりの出力量」であって最初の応答までの待ち時間ではない こと、そして サブスク料金には含まれず別課金 という 2 点です。以下で詳しく見ていきます。

高速モードとは — 同じモデルを 2.5 倍速で動かす仕組み

高速モードは「別の軽量モデルに切り替える」機能ではありません。Claude Opus を、コスト効率よりも速度を優先した推論構成で実行するものです。モデルの重みも挙動も同じなので、知能や機能に変化はなく、レスポンスが速くなるだけ、と公式に明記されています(API Docs)。

速くなる指標は OTPS(output tokens per second / 1 秒あたりの出力トークン数) で、標準速度比で最大 2.5 倍。一方、TTFT(time to first token / 最初のトークンが返るまでの時間)は高速モードの対象外 です。長い回答やコード生成を「書き終わるまで」の体感が縮む一方、最初の反応の速さは変わらない、と理解しておくと期待値を外しません。

対応モデルは Opus 4.8・4.7・4.6 のみ

高速モードが使えるのは Opus 系の 3 モデルだけです。

  • Claude Opus 4.8(claude-opus-4-8)
  • Claude Opus 4.7(claude-opus-4-7)
  • Claude Opus 4.6(claude-opus-4-6)

Sonnet・Haiku など他モデルでは利用できず、API で非対応モデルに speed: "fast" を送るとエラーになります。なお Opus 4.6 の高速モードは Opus 4.8 のリリースをもって非推奨 となり、約 30 日後に削除予定です。削除後は claude-opus-4-6speed: "fast" を付けてもエラーにはならず、標準速度・標準価格へフォールバックします。速さを維持したいなら Opus 4.8 か 4.7 へ移行してください。

Claude Code で使う — /fast でオン・オフ

Claude Code では切り替えがコマンド一発です。手順は次の通り(Claude Code Docs)。

  1. ターミナルで /fast と入力し Tab キーでオン/オフを切り替える(または設定ファイルで "fastMode": true)。
  2. 別モデルを使っていた場合は自動で Opus に切り替わり、「Fast mode ON」と確認が出る。
  3. 有効中はプロンプト横に小さな アイコンが表示される。
  4. もう一度 /fast を実行すると無効化できる(モデルは Opus に留まる。元のモデルへは /model で戻す)。

要件として Claude Code v2.1.36 以降 が必要で、VS Code 拡張では非対応です。デフォルトは Opus 4.8(v2.1.142〜2.1.153 は Opus 4.7 がデフォルト、v2.1.154 以降で Opus 4.8)。コスト効率を最大化するには、会話の途中ではなく セッション開始時に有効化 するのが鉄則です。

API で使う — speed: "fast" パラメータ

API から使う場合は、ベータヘッダー anthropic-beta: fast-mode-2026-02-01 を付け、リクエストに speed: "fast" を指定します。

curl https://api.anthropic.com/v1/messages \
  --header "x-api-key: $ANTHROPIC_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "anthropic-beta: fast-mode-2026-02-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-opus-4-8",
    "max_tokens": 4096,
    "speed": "fast",
    "messages": [{"role": "user", "content": "Refactor this module"}]
  }'

実際にどちらの速度で処理されたかは、レスポンスの usage.speed フィールド("fast""standard")で確認できます。なお高速モードは Batch API・Priority Tier・AWS 上の Claude Platform では利用不可。また Vertex AI / Amazon Bedrock / Microsoft Foundry などサードパーティ基盤でも提供されません(Claude API 上のリサーチプレビュー限定)。

料金 — Opus 4.8 は入力 $10・出力 $50/100万トークン

高速モードは標準料金にモデル別の倍率がかかる価格設定で、1M コンテキスト全体で一定 です。

モデル 入力(100万トークン) 出力(100万トークン)
Opus 4.8 $10 $50
Opus 4.7 / 4.6 $30 $150

Opus 4.8 の高速モード価格は旧世代(4.7/4.6)の約 3 分の 1 まで下がっており、速度を選びやすくなりました。プロンプトキャッシングやデータレジデンシーの倍率は、この高速モード価格に上乗せで適用されます。

サブスクでも従量課金 — 使用量クレジットが必須

ここが一番の注意点です。Claude Code の高速モードは Pro/Max/Team/Enterprise の各プランと Console ユーザーが使えますが、サブスクのレート制限には含まれず、使用量クレジット(usage credits)へ直接課金 されます。プランに残量があっても、高速モードのトークンは最初の 1 トークンから高速モード料金で請求される、と明記されています。

そのため利用には次が必要です。

  1. アカウントで使用量クレジットを有効化しておく(個人は Console の請求設定から)。
  2. Team / Enterprise はデフォルト無効のため、管理者が明示的に高速モードを有効化する。

コストを抑えたい組織は、管理設定で fastModePerSessionOptIn: true を入れると、セッションごとに毎回オフから始まり、必要時だけ /fast で有効化させられます。完全に封じるなら環境変数 CLAUDE_CODE_DISABLE_FAST_MODE=1 を設定します。

高速モードと努力(effort)レベルの違い

「速くする」手段にはもう一つ努力レベルがあり、両者は仕組みが異なります。

設定 効果
高速モード 同じ品質のまま低レイテンシー・高コスト
低い努力レベル 思考時間を短縮して高速化。複雑なタスクでは品質低下の可能性

品質を落とさず速くしたいなら高速モード、思考量そのものを削ってよい単純タスクなら低い努力レベル、という住み分けです。両方を併用して「単純タスク × 最大速度」を狙うこともできます。

レート制限とフォールバックの挙動

高速モードには標準 Opus とは別の専用レート制限があり、Opus 4.8/4.7/4.6 は同じプールを共有します。上限超過や使用量クレジット切れの際は次のように動きます。

  1. 高速モードが自動的に標準速度へフォールバックする。
  2. アイコンがグレーになりクールダウンを示す。
  3. 標準速度・標準価格で作業を継続する。
  4. クールダウン終了後、自動で高速モードが再有効化される。

API では超過時に 429retry-after ヘッダーが返り、SDK はデフォルトで最大 2 回まで自動リトライします。即座に標準速度へ切り替えたい場合は 429 を捕捉して speed を外して再送します。ただし 速度を切り替えるとプロンプトキャッシュはミスする(異なる速度はキャッシュ済みプレフィックスを共有しない)点に注意してください。

まとめ — 速さが効く場面を見極めて使う

高速モードは「Claude を速くする」明確な公式手段ですが、万能ではありません。向くのは コード変更の素早い反復・ライブデバッグ・締切が厳しい時間優先の作業 など、レイテンシーがコストに勝つインタラクティブ用途。逆に 速度がさほど重要でない長時間の自動タスク・バッチ/CI・コスト重視のワークロード では標準モードが適しています。サブスクとは別課金になる前提を押さえ、セッション開始時に /fast で有効化する——これが無駄なく速さを得る使い方です。

出典: 高速モード(リサーチプレビュー)- Claude API Docs / 高速モードでレスポンスを高速化 - Claude Code Docs

参考になったら ♡
Clauder Navi 編集部
@clauder_navi

Anthropic の Claude / Claude Code を中心に、日本のエンジニア向けに最新動向と実務 を毎日発信。 運営方針 は メディアについて をご覧ください。