Vertex AI で Claude 4.6 を使う|Sonnet・Opus のモデルID

Vertex AI で Claude 4.6 を使う|Sonnet・Opus のモデルID

「vertex claude 4.6」と検索する人の多くは、Google Cloud の Vertex AI から Claude 4.6 を呼び出すための正確なモデル ID と、Sonnet 4.6・Opus 4.6 のどちらを使うべきかを知りたいはずです。本記事では Google Cloud と Anthropic の公式ドキュメントを基に、Vertex AI 上の Claude 4.6 の現状と実装手順を実務目線で整理します。

結論powered by Claude
「vertex claude 4.6」と検索する人の多くは、Google Cloud の Vertex AI で Claude 4.6 系を呼び出せるのか、正確なモデル ID は何かを知りたいはずです。結論を先に言うと、Vertex AI で使える 4.6 系は Claude Sonnet 4.6(claude-sonnet-4-6Claude Opus 4.6(claude-opus-4-6 の 2 モデルで、どちらも日付サフィックスなしのエイリアス型 ID です。両モデルとも Vertex 上で 1M トークンのコンテキストに対応します。本記事では 2 つの 4.6 モデルの違いと選び分け、モデル ID の取り違え注意点、Model Garden での有効化、AnthropicVertex SDK の呼び出しコード、料金差、4.5 からの移行までを Google Cloud と Anthropic の一次情報で整理します。
目次 (10)

Vertex AI で Claude 4.6 は使えるのか — 結論

結論から言うと、Claude 4.6 系は Vertex AI で「Model-as-a-Service」として利用可能です。Vertex AI で提供されている 4.6 世代は、ミドル級の Claude Sonnet 4.6 とフラッグシップの Claude Opus 4.6 の 2 モデルです。いずれも Vertex AI のフルマネージド基盤上で動くため、GPU やサーバーの管理は不要で、Model Garden から有効化すればすぐに呼び出せます(出典: Claude on Vertex AI(Anthropic Docs))。

4.6 世代の大きな特徴は、Sonnet・Opus の両方が Vertex 上で 1M トークンのコンテキストウィンドウに対応した点です。前世代の Sonnet 4.5 が 200K トークンだったのに対し、Sonnet 4.6 は Vertex で 1M トークンを扱えます。

Claude 4.6 の 2 モデル — Sonnet 4.6 と Opus 4.6 の違い

「Claude 4.6」と一口に言っても、Vertex 上には性格の異なる 2 つのモデルがあります。用途に応じて選び分けるのが基本です。

  • Claude Sonnet 4.6(claude-sonnet-4-6: 性能とコスト・速度のバランスを取った中量級モデル。日常的なコーディング支援、要約、分類、チャットなど幅広い用途で第一候補になります。大量リクエストを安価にさばきたい場合に向きます。
  • Claude Opus 4.6(claude-opus-4-6: Anthropic が「最も強力なモデル」と位置づけるフラッグシップ。複雑なコーディング、長時間の自律的な多段ワークフロー、財務分析や資料生成など、難易度と精度が要求される処理に向きます。

選び分けの目安はシンプルです。まず Sonnet 4.6 で試し、精度や推論の深さが足りないと感じる難タスクだけ Opus 4.6 に上げると、コストを抑えつつ品質を確保できます。両者は API のリクエスト形式が共通なので、後述のコードで model を差し替えるだけで切り替えられます。

Vertex AI での Claude 4.6 モデル ID(取り違え注意)

Vertex AI では model をリクエスト本文ではなくエンドポイント URL に埋め込むため、正しいモデル ID 文字列を知っておくことが何より重要です。Anthropic 公式ドキュメントが掲載する 4.6 系のモデル ID は次のとおりです。

モデル Vertex AI モデル ID コンテキスト
Claude Opus 4.6 claude-opus-4-6 1M トークン
Claude Sonnet 4.6 claude-sonnet-4-6 1M トークン

注意したいのは、4.6 系は 日付サフィックス(@20250929 のような表記)が付かないエイリアス形式で提供される点です。前世代の Sonnet 4.5 は claude-sonnet-4-5@20250929 のようにサフィックス付きでしたが、Sonnet 4.6 以降はサフィックスなしの素朴な形になりました。claude-sonnet-4-6@... のように余計な日付を付けて呼び出すと存在しないモデル ID 扱いになるため、Vertex で 4.6 が「見つからない」エラーが出たときは、まずこのサフィックス有無を疑ってください(出典: Claude on Vertex AI(Anthropic Docs))。

なお Amazon Bedrock など他プラットフォームではモデル ID の命名規則が異なるため、Bedrock 用の文字列をそのまま Vertex に流用しないよう注意が必要です。

Opus 4.6 は何が強いのか — Google Cloud 公式の位置づけ

Claude Opus 4.6 は、2026 年 2 月に Vertex AI で一般提供(GA)されました。Google Cloud は公式ブログで Opus 4.6 を「Anthropic's most powerful model yet(Anthropic のこれまでで最も強力なモデル)」と紹介し、「Opus 4.5 を全ベンチマークで上回る(outperforming Opus 4.5 across all benchmarks)」と説明しています(出典: Expanding Vertex AI with Claude Opus 4.6(Google Cloud Blog))。

同ブログが挙げる Opus 4.6 の主な強みは次のとおりです。

  1. 複雑なコーディングと高度な自動処理の構築 — 多段のソフトウェア開発タスクに強い。
  2. エンタープライズ業務 — 文書・スプレッドシート・プレゼン資料を、専門性のある仕上がりで生成。
  3. 財務分析 — 規制当局への提出書類、市場レポート、社内データを横断して示唆を引き出す。
  4. 多段ワークフローの自動化 — 数十のツールをまたぐ処理を、エラーからの復旧も含めて安定して回す。
  5. コンピュータ操作 — 画面の視覚的解釈と多段の画面操作に依存するワークフローを扱える。

精度を最優先する難タスクでは Opus 4.6、コストと速度を重視する量産処理では Sonnet 4.6、という棲み分けが実務的です。

Model Garden で Claude 4.6 を有効化する手順

Vertex AI で Claude 4.6 を初めて使う場合、まず Model Garden でモデルを有効化します。手順は次のとおりです。

  1. Google Cloud コンソールで対象プロジェクトを選び、Vertex AI の Model Garden を開く。
  2. 検索欄に「Claude」と入力し、使いたいモデル(Claude Sonnet 4.6 または Claude Opus 4.6)のモデルカードを開く。
  3. モデルカードの「有効にする(Enable)」をクリックし、画面の指示に従う。
  4. ローカルから呼び出す場合は、ターミナルで gcloud auth application-default login を実行して GCP に認証する。
  5. 以降はモデル ID とプロジェクト ID、リージョンを指定して API を呼び出す。

Model Garden のモデルカードからの有効化に加え、Google Cloud Marketplace 経由で調達することもできます(出典: Expanding Vertex AI with Claude Opus 4.6(Google Cloud Blog))。

AnthropicVertex SDK で Claude 4.6 を呼び出すコード

Vertex AI の Claude API は通常の Messages API とほぼ同じですが、anthropic_version をリクエスト本文に vertex-2023-10-16 として渡す点が異なります。Anthropic の公式クライアント SDK を使えばこの差分は吸収されます。

Python は次のようにインストールして呼び出します。modelclaude-sonnet-4-6claude-opus-4-6 に差し替えるだけで 4.6 の 2 モデルを切り替えられます。

pip install -U google-cloud-aiplatform "anthropic[vertex]"
from anthropic import AnthropicVertex

client = AnthropicVertex(project_id="MY_PROJECT_ID", region="global")

message = client.messages.create(
    model="claude-sonnet-4-6",  # Opus を使うなら "claude-opus-4-6"
    max_tokens=100,
    messages=[{"role": "user", "content": "Hey Claude!"}],
)
print(message)

TypeScript は専用パッケージを使います。

npm install @anthropic-ai/vertex-sdk
import { AnthropicVertex } from "@anthropic-ai/vertex-sdk";

const client = new AnthropicVertex({ projectId: "MY_PROJECT_ID", region: "global" });

const result = await client.messages.create({
  model: "claude-opus-4-6",
  max_tokens: 100,
  messages: [{ role: "user", content: "Hey Claude!" }],
});

(出典: Claude on Vertex AI(Anthropic Docs)

4.6 は 1M トークン世代 — 大容量入力の注意点

4.6 世代の目玉は、Sonnet 4.6 と Opus 4.6 がそろって Vertex 上で 1M トークンのコンテキストに対応したことです。長大なコードベース全体や大量のドキュメントを 1 回のリクエストに載せられるため、4.5 系では分割が必要だった処理を一括で扱えます。

ただし落とし穴もあります。Vertex AI はリクエストのペイロードを 30MB に制限しているため、大量の画像や長大な文書を送ると、トークン上限に達する前にこの 30MB 制限へ先にぶつかることがあります。1M トークンを前提に巨大な入力を組む場合は、ペイロードサイズも併せて意識してください(出典: Claude on Vertex AI(Anthropic Docs))。

機能面では、プロンプトキャッシュ、拡張思考、ツール使用、Web 検索、引用(Citations)、構造化出力がサポートされます。一方、Files API による入力ソース指定、Message Batches などの一部 API エンドポイント、Managed Agents は Vertex 経由では非対応です。

global・マルチリージョン・リージョンの料金差

Vertex AI には 3 種類のエンドポイントがあり、region パラメータの値で使い分けます。

  1. global エンドポイント(推奨): region="global" を指定。空き容量のあるリージョンへ動的にルーティングし、可用性が最も高く、料金プレミアムもありません。
  2. マルチリージョンエンドポイント: region="us" または region="eu" を指定。指定地域内でデータ常駐を保ちつつ負荷分散します。global より 10% 高い料金です。
  3. リージョンエンドポイント: region="us-east1" のように特定リージョンを指定。単一リージョンのデータ常駐や、プロビジョンドスループット(専用容量)に必要です。同じく 10% のプレミアムが乗ります。

この 10% プレミアムの料金体系は Sonnet 4.5 以降の新しいモデルに適用されるため、4.6 系の Sonnet 4.6・Opus 4.6 も対象です。データ常駐の要件が緩い場合は、追加料金がかからず可用性も高い global エンドポイントが第一選択です(出典: Claude on Vertex AI(Anthropic Docs))。

Claude 4.5 から 4.6 への移行と注意点

4.5 系から 4.6 系へ移行する際は、いくつかの違いを押さえておきましょう。

  1. モデル ID の表記が変わる: 4.5 系の claude-sonnet-4-5@20250929 から、4.6 系はサフィックスなしの claude-sonnet-4-6 になります。エンドポイント URL に埋め込む文字列を正しく差し替えてください。
  2. コンテキストが 200K から 1M へ拡大: Sonnet 4.6 で大容量入力が可能になりますが、前述の 30MB ペイロード制限は引き続き効きます。
  3. 本番ではバージョン固定の方針を確認: 4.6 系はエイリアス形式のため、Anthropic がアップデートを出したタイミングで挙動が変わり得ます。回帰リスクを避けたい場合は、テストを厚くするか、提供状況を Vertex AI Model Garden で随時確認する運用が安全です。

利用可否やリージョンは随時変わります。最新情報は Vertex AI Model Garden で「Claude」を検索するか、Google Cloud の Anthropic Claude モデル一覧 で確認してください。

まとめ

Vertex AI で Claude 4.6 を使うポイントは次のとおりです。4.6 系は Sonnet 4.6(claude-sonnet-4-6)と Opus 4.6(claude-opus-4-6)の 2 モデルで、いずれも日付サフィックスなしのエイリアス形式・1M トークン対応です。バランス重視なら Sonnet 4.6、難タスクの精度重視なら「Opus 4.5 を全ベンチマークで上回る」Opus 4.6 を選びます。実装は Model Garden で有効化し、gcloud auth application-default login で認証した上で、AnthropicVertex SDK にモデル ID と region="global" を渡すだけです。モデル ID のサフィックス有無と 30MB ペイロード制限の 2 点に注意すれば、4.5 からの移行もスムーズに進められます。

参考になったら ♡
Clauder Navi 編集部
@clauder_navi

Anthropic の Claude / Claude Code を中心に、日本のエンジニア向けに最新動向と実務 を毎日発信。 運営方針 は メディアについて をご覧ください。