
Claude Opus 4.7 移行 — 4.6 から詰まる 3 か所
2026 年 4 月 16 日に一般公開された Claude Opus 4.7 には、既存の Opus 4.6 利用者が対応必須の破壊的変更があります。特に temperature / top_p / top_k の指定や、Extended Thinking Budget の設定は HTTP 400 エラー になります。本記事では「今すぐ何をすべきか」を手順で整理します。Claude Opus 4.7 の新機能・性能改善の概要は 発表記事 をご参照ください。
Claude Managed Agents 経由の利用者はモデル名の変更のみで対応完了です。 破壊的変更は Messages API を直接呼び出している箇所にのみ適用されます出典。
Opus 4.6 から 4.7 への移行で必ず詰まる箇所は 3 か所あります。
まずモデル ID を claude-opus-4-6 から claude-opus-4-7 に差し替え、次に temperature / top_p / top_k および thinking.budget_tokens をリクエストから削除してください(残すと HTTP 400 エラーになります)。
思考機能を使う場合は thinking: {type: "adaptive"} と output_config: {effort: "high"} に書き換えるのが 3 つ目のステップです。
Claude Managed Agents 経由の利用者はモデル名の変更のみで完了し、破壊的変更は Messages API を直接呼び出している箇所にのみ適用されます。
目次 (19)
- 4.6 から詰まる 3 か所(400 エラー必発)+ 補足 2 か所
- 詰まる 1/3: サンプリングパラメータ廃止 — temperature / top_p / top_k で 400 エラー
- 詰まる 2/3: Extended Thinking Budget 廃止 — budget_tokens 残置で 400 エラー
- 詰まる 3/3: アシスタントメッセージ prefill 廃止 — 400 エラー(後述)に統合
- 補足 1: Thinking コンテンツのデフォルト省略 — サイレント変更で UX 劣化に注意
- 補足 2: トークナイザー変更 — 同一テキストで最大 1.35 倍トークン消費
- 詰まる 3/3 詳細: アシスタントメッセージ prefill 廃止 — 400 エラー、構造化出力 / システムプロンプトで代替
- コード差分例 — Before / After で 5 行の書き換えポイントを把握
- Python SDK — temperature / top_p / budget_tokens 削除 → Adaptive + effort
- TypeScript SDK — Python と同じ書き換え 5 行(as any でフィールド未対応を回避)
- 運用上の注意 — Opus 4.6 退役は未公表、価格は据え置き、トークン実測必須
- Opus 4.6 のサポート終了予告 — 退役スケジュール未公表(2026-04 時点)
- コスト比較 — 4.6 と 4.7 は単価同一($5/$25 per MTok)、トークン消費は最大 35% 増
- xhigh 努力レベルの使いどころ — コーディング・エージェント用途は xhigh 開始が公式推奨
- 移行チェックリスト保存版 — 必須対応 6 項目 + 推奨 8 項目 + 動作確認
- 必須 6 項目 — モデル ID / temperature / top_p / top_k / budget_tokens / prefill
- 推奨 8 項目 — max_tokens 増 / display 復元 / 画像コスト試算 / xhigh 評価ほか
- 動作確認 — 代表ワークロードでベンチを取り、本番投入前に必ず実測
- 出典(一次情報)
4.6 から詰まる 3 か所(400 エラー必発)+ 補足 2 か所
Opus 4.6 → 4.7 で 必ず詰まる 3 か所 はすべて HTTP 400 を返す破壊的変更です。残り 2 か所(トークナイザー変更・Thinking 省略)はサイレント変更で、品質劣化やコスト増の原因になります出典。
詰まる 1/3: サンプリングパラメータ廃止 — temperature / top_p / top_k で 400 エラー
temperature・top_p・top_k をデフォルト以外の値に設定すると
HTTP 400 エラー が返ります
出典。
対応方法: これらのパラメータをリクエストペイロードから完全に削除してください。
出力傾向を制御したい場合はシステムプロンプトで代替します。
なお temperature = 0 は以前から同一出力を保証するものではありませんでした。
影響箇所の確認方法:
# コードベースで影響箇所を洗い出す例
grep -rn "temperature\|top_p\|top_k" ./src/
詰まる 2/3: Extended Thinking Budget 廃止 — budget_tokens 残置で 400 エラー
thinking: {"type": "enabled", "budget_tokens": N} の指定は
HTTP 400 エラー になります
出典。
Opus 4.7 では Adaptive Thinking が唯一サポートされる思考モードです。
Adaptive Thinking はデフォルトでオフです。思考機能を使う場合は thinking: {type: "adaptive"} を明示的に設定してください。
# Before (Opus 4.6)
thinking = {"type": "enabled", "budget_tokens": 32000}
# After (Opus 4.7)
thinking = {"type": "adaptive"}
output_config = {"effort": "high"}
詰まる 3/3: アシスタントメッセージ prefill 廃止 — 400 エラー(後述)に統合
詰まる 3 か所目は「アシスタントメッセージへの事前入力(prefill)廃止」です。詳細は本セクション内 [補足 1] にまとめました。代替は構造化出力 / システムプロンプト出典。
補足 1: Thinking コンテンツのデフォルト省略 — サイレント変更で UX 劣化に注意
Opus 4.7 では thinking コンテンツがデフォルトで省略されます(display のデフォルトが "omitted" に変更)。
エラーは発生しませんが、推論出力をストリーミング表示しているプロダクトでは
テキスト開始まで長い無音区間 が発生する可能性があります
出典。
推論内容をユーザーに見せたい場合は display: "summarized" を明示してください:
thinking = {
"type": "adaptive",
"display": "summarized", # 省略した場合はデフォルトで "omitted"
}
補足 2: トークナイザー変更 — 同一テキストで最大 1.35 倍トークン消費
Opus 4.7 は新しいトークナイザーを採用しており、同じ入力テキストに対して Opus 4.6 比で 最大約 35% 多いトークン が使用される場合があります(コンテンツ種別により 1.0〜1.35 倍) 出典。
max_tokensの値に余裕を持たせた値への更新を推奨します。- 画像処理を含む場合: 高解像度サポートにより画像 1 枚あたりのトークン消費量も最大約 3 倍に増加します。
/v1/messages/count_tokensエンドポイントで実際の消費量を実測してください。
詰まる 3/3 詳細: アシスタントメッセージ prefill 廃止 — 400 エラー、構造化出力 / システムプロンプトで代替
Opus 4.6 からの累積変更として、アシスタントメッセージへの事前入力(prefill)は 400 エラーになります。 代替として構造化出力(Structured Outputs)またはシステムプロンプトを使用してください 出典。
コード差分例 — Before / After で 5 行の書き換えポイントを把握
Python SDK — temperature / top_p / budget_tokens 削除 → Adaptive + effort
本セクションの要点を以下に整理します。
import anthropic
client = anthropic.Anthropic()
# =====================================================
# Before: Opus 4.6
# =====================================================
response = client.messages.create(
model="claude-opus-4-6",
max_tokens=64000,
temperature=0.7, # 廃止 → 削除
top_p=0.9, # 廃止 → 削除
thinking={
"type": "enabled",
"budget_tokens": 32000 # 廃止 → Adaptive Thinking に変更
},
messages=[{"role": "user", "content": "コードをレビューしてください。"}],
)
# =====================================================
# After: Opus 4.7
# =====================================================
response = client.messages.create(
model="claude-opus-4-7", # モデル ID 更新
max_tokens=64000,
# temperature / top_p / top_k は削除
thinking={"type": "adaptive"}, # Adaptive Thinking
output_config={"effort": "high"}, # 努力レベルを指定
messages=[{"role": "user", "content": "コードをレビューしてください。"}],
)
thinking コンテンツをユーザーに見せたい場合:
# Thinking コンテンツをユーザーに表示する場合
response = client.messages.create(
model="claude-opus-4-7",
max_tokens=64000,
thinking={
"type": "adaptive",
"display": "summarized", # 明示的に有効化
},
output_config={"effort": "high"},
messages=[{"role": "user", "content": "複雑な推論が必要な問題を解いてください。"}],
)
TypeScript SDK — Python と同じ書き換え 5 行(as any でフィールド未対応を回避)
本セクションの要点を以下に整理します。
import Anthropic from "@anthropic-ai/sdk";
const client = new Anthropic();
// =====================================================
// Before: Opus 4.6
// =====================================================
const responseBefore = await client.messages.create({
model: "claude-opus-4-6",
max_tokens: 64000,
temperature: 0.7, // 廃止 → 削除
top_p: 0.9, // 廃止 → 削除
thinking: {
type: "enabled",
budget_tokens: 32000, // 廃止 → Adaptive Thinking に変更
},
messages: [{ role: "user", content: "コードをレビューしてください。" }],
} as any);
// =====================================================
// After: Opus 4.7
// =====================================================
const responseAfter = await client.messages.create({
model: "claude-opus-4-7", // モデル ID 更新
max_tokens: 64000,
// temperature / top_p / top_k は削除
thinking: { type: "adaptive" }, // Adaptive Thinking
output_config: { effort: "high" }, // 努力レベルを指定
messages: [{ role: "user", content: "コードをレビューしてください。" }],
} as any);
運用上の注意 — Opus 4.6 退役は未公表、価格は据え置き、トークン実測必須
Opus 4.6 のサポート終了予告 — 退役スケジュール未公表(2026-04 時点)
現時点では Opus 4.6 の退役スケジュールは Anthropic から公表されていません(現時点では公表なし)。 公式の廃止情報は Anthropic モデル廃止ページ でご確認ください。
参考として: Claude Sonnet 4 および Claude Opus 4(いずれも 20250514 スナップショット)は
2026年6月15日 に退役予定と公表されています
出典。
コスト比較 — 4.6 と 4.7 は単価同一($5/$25 per MTok)、トークン消費は最大 35% 増
本セクションの要点を以下に整理します。
| 区分 | 単価(税別・USD) |
|---|---|
| 入力トークン | $5.00 / 100万トークン |
| 出力トークン | $25.00 / 100万トークン |
Opus 4.6 からの価格変更はありません 出典。 最新・正確な価格は出典でご確認ください。
注意: トークナイザー変更により同じ入力でもトークン消費量が増加する場合があります(最大 35% 増)。 実際のコストは本番移行前に代表的なワークロードで実測することを推奨します。
xhigh 努力レベルの使いどころ — コーディング・エージェント用途は xhigh 開始が公式推奨
Opus 4.7 で新たに追加された xhigh 努力レベルは、コーディングおよびエージェント用途に最適な設定 です
出典。
| 努力レベル | 推奨用途 |
|---|---|
max |
最高精度が必要なタスク。過剰思考になる場合があるため要テスト |
xhigh |
コーディング・エージェント用途に推奨(Opus 4.7 新設) |
high |
デフォルト。ほとんどの知識集約タスクに適切 |
medium |
コスト重視でやや精度を落として良い場合 |
low |
短い・スコープが明確・レイテンシ優先タスク |
出典:出典xhigh または max を使用する場合は max_tokens を
最低でも 64,000 トークン以上 に設定することが推奨されます
出典。
xhigh 利用時のトークン消費量の具体的な倍率は、ワークロードやタスクの複雑度によって変動します。本番利用前に実際のワークロードで実測してください。
移行チェックリスト保存版 — 必須対応 6 項目 + 推奨 8 項目 + 動作確認
コピーしてご利用ください。
必須 6 項目 — モデル ID / temperature / top_p / top_k / budget_tokens / prefill
本セクションの要点を以下に整理します。
- モデル ID を
claude-opus-4-6→claude-opus-4-7に変更 temperatureをリクエストから削除top_pをリクエストから削除top_kをリクエストから削除thinking: {type: "enabled", budget_tokens: N}を削除
→ 代替: thinking: {type: "adaptive"} + output_config: {effort: "high"}
- アシスタントメッセージ prefill を削除
→ 代替: 構造化出力またはシステムプロンプト
推奨 8 項目 — max_tokens 増 / display 復元 / 画像コスト試算 / xhigh 評価ほか
本セクションの要点を以下に整理します。
max_tokensを余裕を持った値に更新(トークナイザー変更対応)- 推論内容を表示している箇所:
thinking.display = "summarized"を追加 - 画像を扱う処理: 高解像度対応のコスト試算を更新(最大約 3 倍)
- コーディング・エージェント用途:
effortを"xhigh"に設定して評価 - エージェントループ: Task Budgets (beta) の導入を検討
- クライアント側トークン推算コード: Opus 4.7 で実測・再調整
- 座標変換コード: スケールファクター変換を削除(1:1 ピクセル対応)
- サイバーセキュリティ関連タスク: Cyber Verification Program に申請
動作確認 — 代表ワークロードでベンチを取り、本番投入前に必ず実測
本セクションの要点を以下に整理します。
- エンド・ツー・エンドのコスト・レイテンシを再計測
- 出力スタイル(文体・長さ・リアクション)を再評価
- エージェントワークフローのツール呼び出し頻度を確認
- 長時間エージェントの進捗メッセージの形式を確認
出典(一次情報)
-出典— 新機能・破壊的変更の詳細 -出典— 公式移行ガイド(チェックリスト含む) -出典— Adaptive Thinking の API 仕様・コード例 -出典— 努力レベルの設定 -出典— モデル一覧・価格(参照: 2026-04-23) -出典— モデル退役スケジュール
- Anthropic: Pricing — 最新価格(参照: 2026-04-23)