Claude Opus 4.6 → 4.7 移行実務ガイド — 破壊的変更と手順を完全整理

Claude Opus 4.7 移行｜4.6 から詰まる 3 か所と対策を解説

News

Clauder Navi 編集部 / 最終更新 2026-04-26

Claude Opus 4.6 から 4.7 へ移行した瞬間に HTTP 400 が連発する開発者向けに、必ず詰まる 3 か所の対処法をまとめました。temperature 等の廃止パラメータ削除、Adaptive Thinking への切り替え、prefill 廃止の代替策まで、Python / TypeScript のコード差分とともに最短で 400 を解消できる順序で解説します。

結論

Opus 4.6 → 4.7 で 必ず HTTP 400 を返す破壊的変更は 3 か所 あり、いずれもモデル ID 差し替えだけでは解消しません。temperature / top_p / top_k / thinking.budget_tokens の 4 種のパラメータをリクエストから完全に削除 することが移行の出発点になります。

思考機能を使う場合は Adaptive Thinking が唯一の選択肢 で、thinking: {type: "adaptive"} + output_config: {effort: "high"} を明示設定する必要があります。デフォルトでは思考機能が OFF になるため、4.6 で budget_tokens を使っていたコードは 書き換えなしには動作しません。

見落としやすいのが トークナイザー変更によるトークン消費量増加 で、同一テキストでも最大 1.35 倍、画像は最大 3 倍を消費します。max_tokens を従来値のまま運用するとレスポンス途切れの原因になるため、/v1/messages/count_tokens で事前実測 することを推奨します。

目次 (19)

4.6 から詰まる 3 か所(400 エラー必発)+ 補足 2 か所
詰まる 1/3: サンプリングパラメータ廃止 — temperature / top_p / top_k で 400 エラー
詰まる 2/3: Extended Thinking Budget 廃止 — budget_tokens 残置で 400 エラー
詰まる 3/3: アシスタントメッセージ prefill 廃止 — 400 エラー(後述)に統合
補足 1: Thinking コンテンツのデフォルト省略 — サイレント変更で UX 劣化に注意
補足 2: トークナイザー変更 — 同一テキストで最大 1.35 倍トークン消費
詰まる 3/3 詳細: アシスタントメッセージ prefill 廃止 — 400 エラー、構造化出力 / システムプロンプトで代替
コード差分例 — Before / After で 5 行の書き換えポイントを把握
Python SDK — temperature / top_p / budget_tokens 削除 → Adaptive + effort
TypeScript SDK — Python と同じ書き換え 5 行(as any でフィールド未対応を回避)
運用上の注意 — Opus 4.6 退役は未公表、価格は据え置き、トークン実測必須
Opus 4.6 のサポート終了予告 — 退役スケジュール未公表(2026-04 時点)
コスト比較 — 4.6 と 4.7 は単価同一($5/$25 per MTok)、トークン消費は最大 35% 増
xhigh 努力レベルの使いどころ — コーディング・エージェント用途は xhigh 開始が公式推奨
移行チェックリスト保存版 — 必須対応 6 項目 + 推奨 8 項目 + 動作確認
必須 6 項目 — モデル ID / temperature / top_p / top_k / budget_tokens / prefill
推奨 8 項目 — max_tokens 増 / display 復元 / 画像コスト試算 / xhigh 評価ほか
動作確認 — 代表ワークロードでベンチを取り、本番投入前に必ず実測
出典(一次情報)

4.6 から詰まる 3 か所(400 エラー必発)+ 補足 2 か所

Opus 4.6 → 4.7 で 必ず詰まる 3 か所 はすべて HTTP 400 を返す破壊的変更です。残り 2 か所(トークナイザー変更・Thinking 省略)はサイレント変更で、品質劣化やコスト増の原因になります出典。

詰まる 1/3: サンプリングパラメータ廃止 — temperature / top_p / top_k で 400 エラー

temperature・top_p・top_k をデフォルト以外の値に設定すると HTTP 400 エラー が返ります出典。

対応方法: これらのパラメータをリクエストペイロードから完全に削除してください。出力傾向を制御したい場合はシステムプロンプトで代替します。なお temperature = 0 は以前から同一出力を保証するものではありませんでした。

影響箇所の確認方法:

# コードベースで影響箇所を洗い出す例
grep -rn "temperature\|top_p\|top_k" ./src/

詰まる 2/3: Extended Thinking Budget 廃止 — `budget_tokens` 残置で 400 エラー

thinking: {"type": "enabled", "budget_tokens": N} の指定は HTTP 400 エラー になります出典。 Opus 4.7 では Adaptive Thinking が唯一サポートされる思考モードです。

Adaptive Thinking はデフォルトでオフです。思考機能を使う場合は thinking: {type: "adaptive"} を明示的に設定してください。

# Before (Opus 4.6)
thinking = {"type": "enabled", "budget_tokens": 32000}

# After (Opus 4.7)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}

詰まる 3/3: アシスタントメッセージ prefill 廃止 — 400 エラー(後述)に統合

詰まる 3 か所目は「アシスタントメッセージへの事前入力(prefill)廃止」です。詳細は本セクション内 [補足 1] にまとめました。代替は構造化出力 / システムプロンプト出典。

補足 1: Thinking コンテンツのデフォルト省略 — サイレント変更で UX 劣化に注意

Opus 4.7 では thinking コンテンツがデフォルトで省略されます(display のデフォルトが "omitted" に変更)。エラーは発生しませんが、推論出力をストリーミング表示しているプロダクトでは テキスト開始まで長い無音区間 が発生する可能性があります出典。

推論内容をユーザーに見せたい場合は display: "summarized" を明示してください:

thinking = {
    "type": "adaptive",
    "display": "summarized",  # 省略した場合はデフォルトで "omitted"
}

補足 2: トークナイザー変更 — 同一テキストで最大 1.35 倍トークン消費

Opus 4.7 は新しいトークナイザーを採用しており、同じ入力テキストに対して Opus 4.6 比で 最大約 35% 多いトークン が使用される場合があります(コンテンツ種別により 1.0〜1.35 倍) 出典。

max_tokens の値に余裕を持たせた値への更新を推奨します。
画像処理を含む場合: 高解像度サポートにより画像 1 枚あたりのトークン消費量も最大約 3 倍に増加します。
/v1/messages/count_tokens エンドポイントで実際の消費量を実測してください。

詰まる 3/3 詳細: アシスタントメッセージ prefill 廃止 — 400 エラー、構造化出力 / システムプロンプトで代替

Opus 4.6 からの累積変更として、アシスタントメッセージへの事前入力(prefill)は 400 エラーになります。代替として構造化出力(Structured Outputs)またはシステムプロンプトを使用してください出典。

コード差分例 — Before / After で 5 行の書き換えポイントを把握

Python SDK — temperature / top_p / budget_tokens 削除 → Adaptive + effort

本セクションの要点を以下に整理します。

import anthropic

client = anthropic.Anthropic()

# =====================================================
# Before: Opus 4.6
# =====================================================
response = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=64000,
    temperature=0.7,           # 廃止 → 削除
    top_p=0.9,                 # 廃止 → 削除
    thinking={
        "type": "enabled",
        "budget_tokens": 32000  # 廃止 → Adaptive Thinking に変更
    },
    messages=[{"role": "user", "content": "コードをレビューしてください。"}],
)

# =====================================================
# After: Opus 4.7
# =====================================================
response = client.messages.create(
    model="claude-opus-4-7",   # モデル ID 更新
    max_tokens=64000,
    # temperature / top_p / top_k は削除
    thinking={"type": "adaptive"},          # Adaptive Thinking
    output_config={"effort": "high"},       # 努力レベルを指定
    messages=[{"role": "user", "content": "コードをレビューしてください。"}],
)

thinking コンテンツをユーザーに見せたい場合:

# Thinking コンテンツをユーザーに表示する場合
response = client.messages.create(
    model="claude-opus-4-7",
    max_tokens=64000,
    thinking={
        "type": "adaptive",
        "display": "summarized",  # 明示的に有効化
    },
    output_config={"effort": "high"},
    messages=[{"role": "user", "content": "複雑な推論が必要な問題を解いてください。"}],
)

TypeScript SDK — Python と同じ書き換え 5 行(`as any` でフィールド未対応を回避)

本セクションの要点を以下に整理します。

import Anthropic from "@anthropic-ai/sdk";

const client = new Anthropic();

// =====================================================
// Before: Opus 4.6
// =====================================================
const responseBefore = await client.messages.create({
  model: "claude-opus-4-6",
  max_tokens: 64000,
  temperature: 0.7,          // 廃止 → 削除
  top_p: 0.9,                // 廃止 → 削除
  thinking: {
    type: "enabled",
    budget_tokens: 32000,    // 廃止 → Adaptive Thinking に変更
  },
  messages: [{ role: "user", content: "コードをレビューしてください。" }],
} as any);

// =====================================================
// After: Opus 4.7
// =====================================================
const responseAfter = await client.messages.create({
  model: "claude-opus-4-7",   // モデル ID 更新
  max_tokens: 64000,
  // temperature / top_p / top_k は削除
  thinking: { type: "adaptive" },           // Adaptive Thinking
  output_config: { effort: "high" },        // 努力レベルを指定
  messages: [{ role: "user", content: "コードをレビューしてください。" }],
} as any);

運用上の注意 — Opus 4.6 退役は未公表、価格は据え置き、トークン実測必須

Opus 4.6 のサポート終了予告 — 退役スケジュール未公表(2026-04 時点)

現時点では Opus 4.6 の退役スケジュールは Anthropic から公表されていません(現時点では公表なし)。公式の廃止情報は Anthropic モデル廃止ページでご確認ください。

参考として: Claude Sonnet 4 および Claude Opus 4(いずれも 20250514 スナップショット)は 2026年6月15日 に退役予定と公表されています出典。

コスト比較 — 4.6 と 4.7 は単価同一($5/$25 per MTok)、トークン消費は最大 35% 増

本セクションの要点を以下に整理します。

区分	単価(税別・USD)
入力トークン	$5.00 / 100万トークン
出力トークン	$25.00 / 100万トークン

Opus 4.6 からの価格変更はありません出典。最新・正確な価格は出典でご確認ください。

注意: トークナイザー変更により同じ入力でもトークン消費量が増加する場合があります(最大 35% 増)。実際のコストは本番移行前に代表的なワークロードで実測することを推奨します。

xhigh 努力レベルの使いどころ — コーディング・エージェント用途は xhigh 開始が公式推奨

Opus 4.7 で新たに追加された xhigh 努力レベルは、コーディングおよびエージェント用途に最適な設定 です出典。

努力レベル	推奨用途
`max`	最高精度が必要なタスク。過剰思考になる場合があるため要テスト
`xhigh`	コーディング・エージェント用途に推奨(Opus 4.7 新設)
`high`	デフォルト。ほとんどの知識集約タスクに適切
`medium`	コスト重視でやや精度を落として良い場合
`low`	短い・スコープが明確・レイテンシ優先タスク

出典:出典xhigh または max を使用する場合は max_tokens を 最低でも 64,000 トークン以上 に設定することが推奨されます出典。

xhigh 利用時のトークン消費量の具体的な倍率は、ワークロードやタスクの複雑度によって変動します。本番利用前に実際のワークロードで実測してください。

移行チェックリスト保存版 — 必須対応 6 項目 + 推奨 8 項目 + 動作確認

コピーしてご利用ください。

必須 6 項目 — モデル ID / temperature / top_p / top_k / budget_tokens / prefill

本セクションの要点を以下に整理します。

モデル ID を claude-opus-4-6 → claude-opus-4-7 に変更
temperature をリクエストから削除
top_p をリクエストから削除
top_k をリクエストから削除
thinking: {type: "enabled", budget_tokens: N} を削除

→ 代替: thinking: {type: "adaptive"} + output_config: {effort: "high"}

アシスタントメッセージ prefill を削除

→ 代替: 構造化出力またはシステムプロンプト

推奨 8 項目 — max_tokens 増 / display 復元 / 画像コスト試算 / xhigh 評価ほか

本セクションの要点を以下に整理します。

max_tokens を余裕を持った値に更新(トークナイザー変更対応)
推論内容を表示している箇所: thinking.display = "summarized" を追加
画像を扱う処理: 高解像度対応のコスト試算を更新(最大約 3 倍)
コーディング・エージェント用途: effort を "xhigh" に設定して評価
エージェントループ: Task Budgets (beta) の導入を検討
クライアント側トークン推算コード: Opus 4.7 で実測・再調整
座標変換コード: スケールファクター変換を削除(1:1 ピクセル対応)
サイバーセキュリティ関連タスク: Cyber Verification Program に申請

動作確認 — 代表ワークロードでベンチを取り、本番投入前に必ず実測

本セクションの要点を以下に整理します。

エンド・ツー・エンドのコスト・レイテンシを再計測
出力スタイル(文体・長さ・リアクション)を再評価
エージェントワークフローのツール呼び出し頻度を確認
長時間エージェントの進捗メッセージの形式を確認

出典(一次情報)

-出典— 新機能・破壊的変更の詳細 -出典— 公式移行ガイド(チェックリスト含む) -出典— Adaptive Thinking の API 仕様・コード例 -出典— 努力レベルの設定 -出典— モデル一覧・価格(参照: 2026-04-23) -出典— モデル退役スケジュール

Anthropic: Pricing — 最新価格(参照: 2026-04-23)

参考になったら ♡

この記事は役立ちましたか?

ご注意: Clauder Navi は Anthropic 公式情報を直接参照し正確な内容に努めておりますが、本記事の内容に基づく投資判断・契約・利用結果による損害について責任を負いかねます。重要な意思決定の際は、必ず Anthropic 公式・claude.com の一次情報をご自身でご確認ください。

Clauder Navi 編集部

@clauder_navi

Anthropic の Claude / Claude Code を中心に、日本のエンジニア向けに最新動向と実務を毎日発信。運営方針はメディアについてをご覧ください。

プロフィール → 副社長コラム → レッスン一覧 →

Claude Opus 4.7 移行｜4.6 から詰まる 3 か所と対策を解説

4.6 から詰まる 3 か所(400 エラー必発)+ 補足 2 か所

詰まる 1/3: サンプリングパラメータ廃止 — temperature / top_p / top_k で 400 エラー

詰まる 2/3: Extended Thinking Budget 廃止 — budget_tokens 残置で 400 エラー

詰まる 3/3: アシスタントメッセージ prefill 廃止 — 400 エラー(後述)に統合

補足 1: Thinking コンテンツのデフォルト省略 — サイレント変更で UX 劣化に注意

補足 2: トークナイザー変更 — 同一テキストで最大 1.35 倍トークン消費

詰まる 3/3 詳細: アシスタントメッセージ prefill 廃止 — 400 エラー、構造化出力 / システムプロンプトで代替

コード差分例 — Before / After で 5 行の書き換えポイントを把握

Python SDK — temperature / top_p / budget_tokens 削除 → Adaptive + effort

TypeScript SDK — Python と同じ書き換え 5 行(as any でフィールド未対応を回避)

運用上の注意 — Opus 4.6 退役は未公表、価格は据え置き、トークン実測必須

Opus 4.6 のサポート終了予告 — 退役スケジュール未公表(2026-04 時点)

コスト比較 — 4.6 と 4.7 は単価同一($5/$25 per MTok)、トークン消費は最大 35% 増

xhigh 努力レベルの使いどころ — コーディング・エージェント用途は xhigh 開始が公式推奨

移行チェックリスト保存版 — 必須対応 6 項目 + 推奨 8 項目 + 動作確認

必須 6 項目 — モデル ID / temperature / top_p / top_k / budget_tokens / prefill

推奨 8 項目 — max_tokens 増 / display 復元 / 画像コスト試算 / xhigh 評価ほか

動作確認 — 代表ワークロードでベンチを取り、本番投入前に必ず実測

出典(一次情報)

関連記事

Anthropic 速報｜Desktop Extensions と Claude Code /rewind

Anthropic 速報｜全SDK system.message ストリーミング対応

Anthropic 速報｜Claude Tag Slack チーム参加と MCP CLI 認証

Anthropic 速報｜Claude Code v2.1.185 API 待機改善と SDK 更新

詰まる 2/3: Extended Thinking Budget 廃止 — `budget_tokens` 残置で 400 エラー

TypeScript SDK — Python と同じ書き換え 5 行(`as any` でフィールド未対応を回避)