
Vertex AI で Claude を呼び出す方法|モデルID・認証・料金

Google Cloud の Vertex AI では、Anthropic の Claude モデルを GCP のインフラから直接呼び出せます。「Vertex AI で Claude を使いたいが、どのモデル ID を指定すればいいのか」「認証や SDK の設定はどうするのか」という疑問を持つエンジニアに向けて、Anthropic 公式ドキュメントと Google Cloud の一次情報をもとに整理します。
目次 (10)
Vertex AI の Claude とは
Vertex AI の Claude は、Google Cloud のマネージド AI プラットフォームから Anthropic の Claude モデルを呼び出せるサービスです。Anthropic は 2023 年以降、Google と資本・技術の両面でパートナーシップを結んでおり、Claude の各世代モデルが Vertex AI の Model Garden を通じて提供されています。
Vertex AI 経由で Claude を使う主なメリットは次のとおりです。
- GCP の既存プロジェクトに組み込める(IAM 認証、VPC サービスコントロールなど)
- データはゼロデータリテンション(Google Cloud Vertex AI の規定に準拠)
- エンタープライズ向けのコンプライアンス・監査ログが利用できる
- グローバル・マルチリージョン・リージョンエンドポイントを選択できる
出典:Claude on Vertex AI — Anthropic Docs
利用できるモデルとモデルID一覧
2026 年 6 月時点で Vertex AI から呼び出せる Claude モデルと API モデル ID の一覧です。Vertex AI では、モデル ID はリクエスト URL のパスに含める形で指定します(Anthropic 直接 API とは指定方法が異なります)。
| モデル名 | Vertex AI モデルID |
|---|---|
| Claude Opus 4.8 | claude-opus-4-8 |
| Claude Opus 4.7 | claude-opus-4-7 |
| Claude Opus 4.6 | claude-opus-4-6 |
| Claude Sonnet 4.6 | claude-sonnet-4-6 |
| Claude Sonnet 4.5 | claude-sonnet-4-5@20250929 |
| Claude Haiku 4.5 | claude-haiku-4-5@20251001 |
| Claude Opus 4.5 | claude-opus-4-5@20251101 |
Claude Opus 4.8 / 4.7 / 4.6 と Claude Sonnet 4.6 は 1M トークンのコンテキストウィンドウに対応しています。その他のモデルは 200k トークンです。また Vertex AI のリクエストペイロードは 30MB の上限があり、大容量ドキュメントや多数の画像送信時はトークン上限より先に制限に達ことがあります。
なお、モデル提供状況はリージョンによって異なる場合があります。最新情報は Vertex AI Model Garden で「Claude」を検索するか、Google Cloud の Claude on Vertex AI ページを参照してください。
事前準備:GCP プロジェクトと Model Garden の有効化
Vertex AI で Claude を呼び出すには、まず Google Cloud Console 側での準備が必要です。
- Google Cloud プロジェクトを用意し、Vertex AI API を有効化します
- Vertex AI Model Garden を開き「Anthropic Claude」を検索します
- 使用するモデルのページで「Enable」または利用規約への同意を完了します
- Anthropic との利用規約に同意すると、そのモデルへの API アクセスが有効になります
この手順を完了しないと、API 呼び出し時に権限エラーが返ります。新しいモデルを使い始める際はモデルごとに有効化が必要です。
SDK のインストール
Anthropic は Vertex AI 向けに公式 SDK を提供しています。Python と TypeScript が最も広く使われています。
Python:
pip install -U google-cloud-aiplatform "anthropic[vertex]"
TypeScript / Node.js:
npm install @anthropic-ai/vertex-sdk
C#、Go、Java、PHP、Ruby 向けの SDK も公式で提供されています。詳細は Anthropic クライアント SDK ドキュメントを参照してください。
認証設定(gcloud コマンド)
Vertex AI の Claude 呼び出しには、Google Cloud の認証情報(Application Default Credentials)が必要です。ローカル開発環境では次のコマンドで認証します。
gcloud auth application-default login
これにより ~/.config/gcloud/application_default_credentials.json が生成され、SDK が自動的に読み込みます。本番環境ではサービスアカウントを使った認証が推奨されます。
Python での基本的な呼び出しコード
認証が完了したら、以下のコードで Claude を呼び出せます。project_id には GCP プロジェクト ID を指定します。
from anthropic import AnthropicVertex
project_id = "MY_PROJECT_ID"
region = "global" # グローバルエンドポイント推奨
client = AnthropicVertex(project_id=project_id, region=region)
message = client.messages.create(
model="claude-opus-4-8",
max_tokens=1024,
messages=[
{
"role": "user",
"content": "Vertex AI 経由で Claude を呼び出しています。",
}
],
)
print(message.content[0].text)
TypeScript では @anthropic-ai/vertex-sdk の AnthropicVertex クラスを同様に使用します。
import { AnthropicVertex } from "@anthropic-ai/vertex-sdk";
const client = new AnthropicVertex({
projectId: "MY_PROJECT_ID",
region: "global",
});
const result = await client.messages.create({
model: "claude-opus-4-8",
max_tokens: 1024,
messages: [{ role: "user", content: "Hello from Vertex AI!" }],
});
console.log(result.content[0]);
Vertex AI ではリクエストボディの形式が Anthropic 直接 API と 2 点だけ異なります。モデル指定は URL パスで行い(リクエストボディに含めない)、anthropic_version をボディに "vertex-2023-10-16" として渡す必要があります。SDK を使う場合はこれらの差異を自動的に吸収してくれます。
グローバル・マルチリージョン・リージョンエンドポイントの違い
Vertex AI では 3 種類のエンドポイントから選択できます。
グローバルエンドポイント(推奨)
region = "global" と指定します。空き容量のあるリージョンへ動的にルーティングするため可用性が最も高くなります。料金の追加プレミアムはなく、従量課金のみ対応です。データ所在地が柔軟なアプリケーションに最適です。
マルチリージョンエンドポイント
region = "us" または region = "eu" と指定します。地理的なデータ所在地を米国または EU に限定したい場合に使います。グローバルより 10% の料金プレミアムが発生します。
リージョンエンドポイント
region = "us-east1" のように特定リージョンを指定します。厳格なデータ所在地要件や Provisioned Throughput(確定スループット)が必要な場合に使います。こちらも 10% の料金プレミアムが発生します。Provisioned Throughput を使用したい場合はリージョンエンドポイント一択です。
料金の考え方
Vertex AI での Claude 利用料金は Anthropic 直接 API と同水準ですが、エンドポイント種別によって差があります。グローバルエンドポイントはプレミアムなし、マルチリージョン・リージョンエンドポイントは +10% のプレミアムが適用されます(Claude Sonnet 4.5 以降の新モデルが対象)。
最新の料金は以下で確認してください。
対応機能と非対応機能
Vertex AI の Claude が対応している主な機能です。
対応機能
- Messages API
- プロンプトキャッシング(柔軟な TTL 設定付き)
- 拡張思考(Extended Thinking)
- ツール使用(Bash ツール、コンピューター操作ツール、テキストエディターツール)
- ウェブ検索ツール
- 構造化出力
- バッチ予測(Batch Predictions)
- アクティビティログ(リクエスト・レスポンスの記録)
非対応機能
- Files API(URL ソース経由の画像・ドキュメント入力)
- Message Batches API エンドポイント
- Managed Agents / MCP コネクター
- Models・Admin・Usage and Cost API エンドポイント
- コード実行ツール、Web Fetch ツール(サーバーサイドツール)
機能の完全なリストは Anthropic Features overview で確認できます。
Vertex AI か直接 API かを選ぶ基準
Vertex AI 経由での Claude 利用が向いているのは、既存の GCP インフラに統合したい場合や、Google Cloud の IAM・コンプライアンス・監査ログ機能を活用したい場合です。特に企業内システムでの利用やデータ所在地の制御が求められる場面に強みがあります。
一方、個人開発や小規模プロジェクト、あるいは Files API や Managed Agents などの最新機能をすぐに使いたい場合は、Anthropic の直接 API の方が選択肢が広くなります。
Claude は Vertex AI のほか、Amazon Bedrock や Microsoft Foundry でも利用できます。クラウド環境や開発スタックに合わせてプラットフォームを選択してください。