
Claude xhigh とは|5段階エフォートの使い分けと設定方法
Claude の xhigh は 2026年4月16日に Claude Opus 4.7 向けとして追加されたエフォートレベルです。high と max の中間に位置し、コーディング・エージェント用途の推奨開始点として Anthropic 公式が明記しています。本記事では xhigh の概要・5段階エフォートの比較・API / Claude Code での設定手順・トークン消費量の目安まで、実装に必要な情報をまとめました。
xhigh は Claude Opus 4.7 / 4.8 向けの エフォートレベル第4段階 で、高難度コーディングや長時間エージェント作業(30分超)に最適化されています。API デフォルトは high のため、xhigh を使うには output_config: { effort: "xhigh" } を明示的に指定する必要があります。
Claude Code では /effort xhigh コマンドまたは --effort xhigh フラグで設定でき、v2.1.154 以降は Max プランの新規セッションで xhigh がデフォルト化されています。
xhigh は high の数倍のトークンを消費することがあるため、max_tokens は 64k 以上を起点に設定することを Anthropic が推奨しています。「まず xhigh で試し、品質不足が評価指標で確認できた場合のみ max に移行する」が費用対効果の観点から合理的な使い方です。
目次 (8)
Claude xhigh とは — high と max の間に追加された推論強度設定
Claude の effort(エフォート)パラメータは、モデルが応答に費やすトークン量を段階的にコントロールする設定です。エフォートを上げるほど推論の深度と精度が向上しますが、処理時間とコストも増加します。
xhigh は Claude Code v2.1.111 とともに 2026年4月16日に追加されたレベルで、Claude Opus 4.7 に初対応し、その後 Claude Opus 4.8 にも拡張されました。
Anthropic の公式ドキュメントは次のように位置づけています。
Start with
xhighfor coding and agentic use cases, and usehighas the minimum for most intelligence-sensitive workloads.
xhigh が対象とするのは「長時間のエージェント的コーディングタスク(30分超)」で、反復的なツール呼び出し、詳細なウェブ検索、ナレッジベース検索のような探索的な処理に特に効果を発揮します。API のデフォルトは high であるため、xhigh を利用するには明示的な指定が必要です。
5段階エフォートレベル早見表
公式ドキュメントが定義する5段階を比較します。
| レベル | 概要 | 主な用途 | 対応モデル |
|---|---|---|---|
max |
トークン制限なし・最高性能 | フロンティア級の推論が必要な問題 | Opus 4.8/4.7/4.6, Sonnet 4.6 |
xhigh |
長時間エージェント・コーディング向け拡張性能 | 30分超のコーディング・反復ツール呼び出し | Opus 4.8/4.7 のみ |
high |
デフォルト・高性能 | 複雑な推論・難易度の高いコーディング | 全対応モデル |
medium |
バランス重視 | コスト・速度・品質のトレードオフが必要 | 全対応モデル |
low |
最もトークン効率が高い | 分類・単純検索・大量処理の子エージェント | 全対応モデル |
xhigh は Claude Opus 4.7 と Opus 4.8 のみ で利用できます。Sonnet 4.6 など他モデルに xhigh を指定するとエラーになるため注意が必要です。
パラメータを省略した場合は high と同等の動作となります。effort: "high" を明示しても結果は同じです。
xhigh が推奨されるユースケース
Anthropic の公式ドキュメントが xhigh を推奨する場面は次の通りです。
- 高難度コーディング — 複数ファイルにまたがるリファクタリング、テスト全件修正、パフォーマンスチューニングなど、深い探索が求められる実装
- 長時間エージェント作業 — サブエージェントを何度も呼び出しながら進める複雑なワークフロー(30分以上かかるタスク)
- 反復的なツール呼び出し — ウェブ検索やコードベース検索を繰り返して答えを段階的に組み立てるタスク
- 詳細なナレッジベース検索 — 大量のドキュメントから正確な情報を掘り起こす調査系の処理
一方、短時間で完了する単純な質問応答・テキスト要約・軽量な分類タスクには high や medium の方がコスト効率に優れます。
公式ガイドラインのポイントとして「知性の重要度が高いほとんどのユースケースでは high を最低ラインとし、コーディング・エージェント用途では xhigh から始める」という原則があります。
API での xhigh 設定方法
API から xhigh を指定するには output_config オブジェクトに effort: "xhigh" を渡します。
Python の例:
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=64000,
messages=[
{
"role": "user",
"content": "このリポジトリ全体をリファクタリングしてテストを修正してください。",
}
],
output_config={"effort": "xhigh"},
)
print(response.content[0].text)
TypeScript の例:
import Anthropic from "@anthropic-ai/sdk";
const client = new Anthropic();
const response = await client.messages.create({
model: "claude-opus-4-8",
max_tokens: 64000,
messages: [
{
role: "user",
content: "このリポジトリ全体をリファクタリングしてテストを修正してください。",
}
],
output_config: {
effort: "xhigh"
}
});
output_config は thinking パラメータと並立して指定できます。Adaptive Thinking と組み合わせる場合については後述します。
Claude Code での xhigh 設定方法
Claude Code では2通りの方法で xhigh を設定できます。
セッション中にコマンドで切り替える場合:
/effort xhigh
Claude Code 起動時にフラグを指定する場合:
claude --effort xhigh
Claude Code v2.1.154 以降、Max プランの新規セッションではデフォルトモデルが Opus 4.8 に切り替わるとともに /effort xhigh がデフォルトで有効化されています(出典)。Pro プランや旧バージョンでは引き続き明示指定が必要です。
Claude Code の /effort メニューには ultracode という選択肢も表示されますが、これは API のエフォートレベルとは別物です。ultracode は xhigh エフォートに加えてマルチエージェントワークフローの自動起動を許可する組み合わせ設定であり、API の effort パラメータとして ultracode という値は存在しません。
xhigh 使用時のトークン消費量と max_tokens の設定
xhigh は high よりも大幅にトークンを消費します。Anthropic の公式ドキュメントは xhigh または max を使用する場合、max_tokens を大きく設定するよう求めており、64k トークンを起点に調整する ことを推奨しています。
トークン消費に関して押さえておくべき点を整理します。
xhighはhigh比で数倍のトークンを消費する場合がある- サブエージェントや複数回のツール呼び出しを含むタスクほど消費量が膨らむ
max_tokensが小さいとモデルが思考・行動の途中で打ち切られ、品質が低下する
コスト管理の実践的なアプローチとして、本番デプロイ前に実際のワークロードでトークン消費量を計測し、タスクの複雑度に応じて effort レベルを下げる段階的評価が有効です。
Adaptive Thinking との組み合わせ方
Claude Opus 4.7 / 4.8 では budget_tokens による思考量の手動指定が廃止され、thinking: {type: "adaptive"} と effort の組み合わせが推奨方式になっています。
response = client.messages.create(
model="claude-opus-4-8",
max_tokens=64000,
messages=[...],
thinking={"type": "adaptive"},
output_config={"effort": "xhigh"},
)
high、xhigh、max のエフォートで Adaptive Thinking を有効にすると、モデルはほぼ常に深く思考します。medium や low では、シンプルな問題に対して思考をスキップする場合があります。
なお、thinking: {type: "adaptive"} を省略した場合でも effort パラメータは有効です。その場合は思考以外のすべてのトークン(テキスト応答・ツール呼び出し)にエフォートが影響します。
xhigh と max — 使い分けの判断基準
xhigh と max の違いはトークン消費量と応答品質のバランスです。Anthropic の公式ガイドラインは次の方針を示しています。
- xhigh を最初の選択肢にする — 多くのコーディング・エージェントタスクでは
xhighで十分な品質が得られる - max は評価指標で差が出た場合のみ —
xhighで品質不足と確認できた場合のみmaxに移行する - max の過剰適用を避ける — 構造化出力や比較的単純なタスクでは
maxがかえって過剰な思考を起こし、品質が下がるケースがある
実務的な運用指針としては、まず xhigh でベースラインを計測し、品質が不十分なタスクのみ max を試す というステップが費用対効果の観点から合理的です。
なお、Claude Opus 4.7 は Opus 4.6 よりもエフォートレベルをより厳格に守ります。low や medium では指示された範囲内に作業を留め、余分な処理を行わない傾向があります。複雑な問題で low や medium を使い推論が浅いと感じた場合は、プロンプトで補うより effort を上げる方が効果的です。