
Vertex AI で Claude 4 を使う|モデルIDと料金・実装コード
「vertex claude 4」と検索する人の多くは、Google Cloud の Vertex AI から Anthropic の Claude 4 系モデルを呼び出せるのか、どのモデル ID を指定し、どう実装すればよいのかを知りたいはずです。本記事では Google Cloud と Anthropic の公式ドキュメントを基に、Vertex AI 上の Claude 4 の現状と実装手順を実務目線で整理します。
目次 (9)
Vertex AI で Claude 4 は使えるのか — 結論
結論から言うと、Claude 4 系は Vertex AI で「Model-as-a-Service(MaaS)」として利用可能です。Anthropic と Google Cloud は 2025 年 5 月 23 日、Claude Opus 4 と Claude Sonnet 4 を Vertex AI で一般提供(GA)したと公式ブログで発表しました(出典: Google Cloud Blog)。両モデルはハイブリッド推論モデルで、即時応答モードと、複雑な問題を深く考える拡張思考(extended thinking)モードを切り替えられます。
その後も後継モデルが追加され、2026 年 6 月時点では Opus 4.5 / 4.6 / 4.7 / 4.8、Sonnet 4.5 / 4.6、Haiku 4.5 が Vertex AI 上で提供されています。Opus 4 や Sonnet 4、Opus 4.1 は「Deprecated(非推奨)」表示に移行していますが、当面は呼び出し可能です。
Vertex AI で使える Claude 4 系モデル ID 早見表
Vertex AI では model をリクエスト本文ではなくエンドポイント URL に埋め込むため、正しいモデル ID 文字列を知っておくことが重要です。Anthropic 公式ドキュメント(Claude on Vertex AI)が掲載する Claude 4 系のモデル ID は次のとおりです。
| モデル | Vertex AI モデル ID | 状態 |
|---|---|---|
| Claude Opus 4.8 | claude-opus-4-8 |
最新 Opus |
| Claude Opus 4.7 | claude-opus-4-7 |
提供中 |
| Claude Opus 4.6 | claude-opus-4-6 |
提供中 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
提供中 |
| Claude Opus 4.1 | claude-opus-4-1@20250805 |
Deprecated |
| Claude Opus 4 | claude-opus-4@20250514 |
Deprecated |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
最新 Sonnet |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
提供中 |
| Claude Sonnet 4 | claude-sonnet-4@20250514 |
Deprecated |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
提供中 |
@ 以降の日付サフィックスはモデルのバージョンを固定する「ピン留め」表記です。最新世代の Opus 4.6 以降はサフィックスなしのエイリアス形式で提供されています。
Claude Opus 4 / Sonnet 4 はいつ Vertex に来たのか
Vertex AI 上の Claude 4 系の起点は、2025 年 5 月 23 日の Opus 4 / Sonnet 4 の GA です。Claude Opus 4 はコーディングや長時間の自律タスクに強く、Claude Sonnet 4 は性能とコストのバランスを取った中量級モデルとして、前世代の Sonnet 3.7 を上回る位置づけで投入されました。いずれも Vertex AI のフルマネージド基盤上で動くため、GPU やサーバーの管理は不要です(出典: Google Cloud Blog)。
Model Garden で Claude 4 を有効化する手順
Vertex AI で Claude 4 を初めて使う場合、まず Model Garden でモデルを有効化します。手順は次のとおりです。
- Google Cloud コンソールで対象プロジェクトを選び、Vertex AI の Model Garden を開く。
- 検索欄に「Claude」と入力し、使いたいモデル(例: Claude Opus 4.8)のモデルカードを開く。
- モデルカードの「有効にする(Enable)」をクリックし、画面の指示に従う。
- ローカルから呼び出す場合は、ターミナルで
gcloud auth application-default loginを実行して GCP に認証する。 - 以降はモデル ID とプロジェクト ID、リージョンを指定して API を呼び出す。
Model Garden のモデルカードからの有効化に加え、Google Cloud Marketplace 経由で調達することもできます(出典: Google Cloud Blog)。
AnthropicVertex SDK で呼び出すコード
Vertex AI の Claude API は通常の Messages API とほぼ同じですが、anthropic_version をリクエスト本文に vertex-2023-10-16 として渡す点が異なります。Anthropic の公式クライアント SDK を使えばこの差分は吸収されます。
Python は次のようにインストールして呼び出します。
pip install -U google-cloud-aiplatform "anthropic[vertex]"
from anthropic import AnthropicVertex
client = AnthropicVertex(project_id="MY_PROJECT_ID", region="global")
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=100,
messages=[{"role": "user", "content": "Hey Claude!"}],
)
print(message)
TypeScript は専用パッケージを使います。
npm install @anthropic-ai/vertex-sdk
import { AnthropicVertex } from "@anthropic-ai/vertex-sdk";
const client = new AnthropicVertex({ projectId: "MY_PROJECT_ID", region: "global" });
const result = await client.messages.create({
model: "claude-opus-4-8",
max_tokens: 100,
messages: [{ role: "user", content: "Hey Claude!" }],
});
(出典: Claude on Vertex AI(Anthropic Docs))
global・マルチリージョン・リージョンの料金差
Vertex AI には 3 種類のエンドポイントがあり、region パラメータの値で使い分けます。
- global エンドポイント(推奨):
region="global"を指定。空き容量のあるリージョンへ動的にルーティングし、可用性が最も高く、料金プレミアムもありません。 - マルチリージョンエンドポイント:
region="us"またはregion="eu"を指定。指定地域内でデータ常駐を保ちつつ負荷分散します。global より 10% 高い料金です。 - リージョンエンドポイント:
region="us-east1"のように特定リージョンを指定。単一リージョンのデータ常駐や、プロビジョンドスループット(専用容量)に必要です。同じく 10% のプレミアムが乗ります。
この料金体系は Claude Sonnet 4.5 以降の新しいモデルに適用され、Opus 4 / Sonnet 4 など旧モデルは従来の料金構造を維持します。データ常駐の要件が緩い場合は、追加料金がかからず可用性も高い global エンドポイントが第一選択です(出典: Claude on Vertex AI(Anthropic Docs))。
1M トークン対応と機能のサポート範囲
コンテキストウィンドウはモデルによって異なります。Opus 4.8 / 4.7 / 4.6 と Sonnet 4.6 は Vertex AI 上で 1M トークンに対応し、Sonnet 4.5 や Sonnet 4 などは 200K トークンです。なお Vertex AI はリクエストのペイロードを 30MB に制限しているため、大量の画像や長大な文書を送るとトークン上限より先にこの制限へ達することがあります。
機能面では、プロンプトキャッシュ、拡張思考、ツール使用(Bash・コンピュータ操作・テキストエディタ等)、Web 検索、引用(Citations)、構造化出力(Structured Outputs)がサポートされます。一方、Files API による入力ソース指定、Message Batches などの一部 API エンドポイント、Managed Agents は Vertex 経由では非対応です。データの取り扱いは Google Cloud Vertex AI のポリシーに従います(出典: Claude on Vertex AI(Anthropic Docs))。
モデル ID のピン留めと移行の注意点
本番運用では、claude-opus-4-5@20251101 のように日付サフィックス付きのモデル ID でバージョンをピン留めすることが推奨されます。サフィックスなしのエイリアスを使うと、Anthropic がアップデートを出したタイミングで挙動が変わり、既存の処理が壊れる可能性があるためです。
また、Vertex 上のモデルの提供状況やリージョンは随時変わります。利用可否は Vertex AI Model Garden で「Claude」を検索するか、Google Cloud の Anthropic Claude モデル一覧 で最新情報を確認してください。Deprecated 表示のモデル(Opus 4 / Sonnet 4 / Opus 4.1 など)は、いずれ終了するため早めに後継世代へ移行しておくと安全です。
まとめ
Vertex AI で Claude 4 を使うポイントは次のとおりです。Opus 4 / Sonnet 4 は 2025 年 5 月 23 日 GA で、現在は Opus 4.8 や Sonnet 4.6 まで後継が揃っています。実装は Model Garden で有効化し、gcloud auth application-default login で認証した上で、AnthropicVertex SDK にモデル ID(例: claude-opus-4-8)とプロジェクト ID、region="global" を渡すだけです。料金を抑えつつ可用性を高めたいなら global エンドポイントが基本で、データ常駐が必要ならマルチリージョンやリージョンを選びます。本番ではモデル ID をピン留めし、Deprecated モデルは早めに移行しておきましょう。