Vertex AI で Claude を呼び出す方法|モデルID・認証・料金

Vertex AI で Claude を呼び出す方法|モデルID・認証・料金

Vertex AI で Claude を呼び出す方法|モデルID・認証・料金

Google Cloud の Vertex AI では、Anthropic の Claude モデルを GCP のインフラから直接呼び出せます。「Vertex AI で Claude を使いたいが、どのモデル ID を指定すればいいのか」「認証や SDK の設定はどうするのか」という疑問を持つエンジニアに向けて、Anthropic 公式ドキュメントと Google Cloud の一次情報をもとに整理します。

結論powered by Claude
![Vertex AI で Claude を呼び出す方法|モデルID・認証・料金](/assets/generated/placeholder-vertex-claude-ai-hero.jpg)
目次 (10)

Vertex AI の Claude とは

Vertex AI の Claude は、Google Cloud のマネージド AI プラットフォームから Anthropic の Claude モデルを呼び出せるサービスです。Anthropic は 2023 年以降、Google と資本・技術の両面でパートナーシップを結んでおり、Claude の各世代モデルが Vertex AI の Model Garden を通じて提供されています。

Vertex AI 経由で Claude を使う主なメリットは次のとおりです。

  • GCP の既存プロジェクトに組み込める(IAM 認証、VPC サービスコントロールなど)
  • データはゼロデータリテンション(Google Cloud Vertex AI の規定に準拠)
  • エンタープライズ向けのコンプライアンス・監査ログが利用できる
  • グローバル・マルチリージョン・リージョンエンドポイントを選択できる

出典:Claude on Vertex AI — Anthropic Docs

利用できるモデルとモデルID一覧

2026 年 6 月時点で Vertex AI から呼び出せる Claude モデルと API モデル ID の一覧です。Vertex AI では、モデル ID はリクエスト URL のパスに含める形で指定します(Anthropic 直接 API とは指定方法が異なります)。

モデル名 Vertex AI モデルID
Claude Opus 4.8 claude-opus-4-8
Claude Opus 4.7 claude-opus-4-7
Claude Opus 4.6 claude-opus-4-6
Claude Sonnet 4.6 claude-sonnet-4-6
Claude Sonnet 4.5 claude-sonnet-4-5@20250929
Claude Haiku 4.5 claude-haiku-4-5@20251001
Claude Opus 4.5 claude-opus-4-5@20251101

Claude Opus 4.8 / 4.7 / 4.6 と Claude Sonnet 4.6 は 1M トークンのコンテキストウィンドウに対応しています。その他のモデルは 200k トークンです。また Vertex AI のリクエストペイロードは 30MB の上限があり、大容量ドキュメントや多数の画像送信時はトークン上限より先に制限に達ことがあります。

なお、モデル提供状況はリージョンによって異なる場合があります。最新情報は Vertex AI Model Garden で「Claude」を検索するか、Google Cloud の Claude on Vertex AI ページを参照してください。

事前準備:GCP プロジェクトと Model Garden の有効化

Vertex AI で Claude を呼び出すには、まず Google Cloud Console 側での準備が必要です。

  1. Google Cloud プロジェクトを用意し、Vertex AI API を有効化します
  2. Vertex AI Model Garden を開き「Anthropic Claude」を検索します
  3. 使用するモデルのページで「Enable」または利用規約への同意を完了します
  4. Anthropic との利用規約に同意すると、そのモデルへの API アクセスが有効になります

この手順を完了しないと、API 呼び出し時に権限エラーが返ります。新しいモデルを使い始める際はモデルごとに有効化が必要です。

SDK のインストール

Anthropic は Vertex AI 向けに公式 SDK を提供しています。Python と TypeScript が最も広く使われています。

Python:

pip install -U google-cloud-aiplatform "anthropic[vertex]"

TypeScript / Node.js:

npm install @anthropic-ai/vertex-sdk

C#、Go、Java、PHP、Ruby 向けの SDK も公式で提供されています。詳細は Anthropic クライアント SDK ドキュメントを参照してください。

認証設定(gcloud コマンド)

Vertex AI の Claude 呼び出しには、Google Cloud の認証情報(Application Default Credentials)が必要です。ローカル開発環境では次のコマンドで認証します。

gcloud auth application-default login

これにより ~/.config/gcloud/application_default_credentials.json が生成され、SDK が自動的に読み込みます。本番環境ではサービスアカウントを使った認証が推奨されます。

Python での基本的な呼び出しコード

認証が完了したら、以下のコードで Claude を呼び出せます。project_id には GCP プロジェクト ID を指定します。

from anthropic import AnthropicVertex

project_id = "MY_PROJECT_ID"
region = "global"  # グローバルエンドポイント推奨

client = AnthropicVertex(project_id=project_id, region=region)

message = client.messages.create(
    model="claude-opus-4-8",
    max_tokens=1024,
    messages=[
        {
            "role": "user",
            "content": "Vertex AI 経由で Claude を呼び出しています。",
        }
    ],
)
print(message.content[0].text)

TypeScript では @anthropic-ai/vertex-sdkAnthropicVertex クラスを同様に使用します。

import { AnthropicVertex } from "@anthropic-ai/vertex-sdk";

const client = new AnthropicVertex({
  projectId: "MY_PROJECT_ID",
  region: "global",
});

const result = await client.messages.create({
  model: "claude-opus-4-8",
  max_tokens: 1024,
  messages: [{ role: "user", content: "Hello from Vertex AI!" }],
});
console.log(result.content[0]);

Vertex AI ではリクエストボディの形式が Anthropic 直接 API と 2 点だけ異なります。モデル指定は URL パスで行い(リクエストボディに含めない)、anthropic_version をボディに "vertex-2023-10-16" として渡す必要があります。SDK を使う場合はこれらの差異を自動的に吸収してくれます。

グローバル・マルチリージョン・リージョンエンドポイントの違い

Vertex AI では 3 種類のエンドポイントから選択できます。

グローバルエンドポイント(推奨) region = "global" と指定します。空き容量のあるリージョンへ動的にルーティングするため可用性が最も高くなります。料金の追加プレミアムはなく、従量課金のみ対応です。データ所在地が柔軟なアプリケーションに最適です。

マルチリージョンエンドポイント region = "us" または region = "eu" と指定します。地理的なデータ所在地を米国または EU に限定したい場合に使います。グローバルより 10% の料金プレミアムが発生します。

リージョンエンドポイント region = "us-east1" のように特定リージョンを指定します。厳格なデータ所在地要件や Provisioned Throughput(確定スループット)が必要な場合に使います。こちらも 10% の料金プレミアムが発生します。Provisioned Throughput を使用したい場合はリージョンエンドポイント一択です。

料金の考え方

Vertex AI での Claude 利用料金は Anthropic 直接 API と同水準ですが、エンドポイント種別によって差があります。グローバルエンドポイントはプレミアムなし、マルチリージョン・リージョンエンドポイントは +10% のプレミアムが適用されます(Claude Sonnet 4.5 以降の新モデルが対象)。

最新の料金は以下で確認してください。

対応機能と非対応機能

Vertex AI の Claude が対応している主な機能です。

対応機能

  • Messages API
  • プロンプトキャッシング(柔軟な TTL 設定付き)
  • 拡張思考(Extended Thinking)
  • ツール使用(Bash ツール、コンピューター操作ツール、テキストエディターツール)
  • ウェブ検索ツール
  • 構造化出力
  • バッチ予測(Batch Predictions)
  • アクティビティログ(リクエスト・レスポンスの記録)

非対応機能

  • Files API(URL ソース経由の画像・ドキュメント入力)
  • Message Batches API エンドポイント
  • Managed Agents / MCP コネクター
  • Models・Admin・Usage and Cost API エンドポイント
  • コード実行ツール、Web Fetch ツール(サーバーサイドツール)

機能の完全なリストは Anthropic Features overview で確認できます。

Vertex AI か直接 API かを選ぶ基準

Vertex AI 経由での Claude 利用が向いているのは、既存の GCP インフラに統合したい場合や、Google Cloud の IAM・コンプライアンス・監査ログ機能を活用したい場合です。特に企業内システムでの利用やデータ所在地の制御が求められる場面に強みがあります。

一方、個人開発や小規模プロジェクト、あるいは Files API や Managed Agents などの最新機能をすぐに使いたい場合は、Anthropic の直接 API の方が選択肢が広くなります。

Claude は Vertex AI のほか、Amazon BedrockMicrosoft Foundry でも利用できます。クラウド環境や開発スタックに合わせてプラットフォームを選択してください。

参考になったら ♡
Clauder Navi 編集部
@clauder_navi

Anthropic の Claude / Claude Code を中心に、日本のエンジニア向けに最新動向と実務 を毎日発信。 運営方針 は メディアについて をご覧ください。