
Vertex AI で Claude を使えるリージョン設定|global vs us・eu
Google Cloud の Vertex AI 経由で Claude を呼び出す際、どのリージョンを選ぶかはパフォーマンス・料金・データの保管場所に直結する。本記事では、利用できるリージョンの種類・設定方法・データレジデンシーの考え方を整理する。
目次 (14)
Vertex AI Claude のリージョンとは
Vertex AI では、Claude モデルを呼び出すエンドポイントとして「どの地理的な場所のサーバーにリクエストを送るか」をリージョンで指定する。指定したリージョンによって以下が変わる。
- レイテンシ: 自拠点に近いリージョンほど応答が速い
- データ保管場所: 業界規制やコンプライアンス要件を満たすために重要
- 料金: グローバルエンドポイントに対し、リージョン指定には 10% の割増がある
- スループット確保: Provisioned Throughput はリージョナルエンドポイントでのみ利用可能
公式情報は Claude on Vertex AI — Claude Docs および Google Cloud ブログ を参照している。
利用できるリージョン一覧
Vertex AI で Claude を呼び出す際のリージョン指定は、大きく 3 種類に分類される。
グローバルエンドポイント(global)
最もシンプルな選択肢。リージョン指定は region="global" で、Google の複数リージョンにまたがる動的ルーティングが行われる。データの保管場所は特定の地域に限定されないため、厳格なデータレジデンシー要件がないプロジェクトに適している。料金の割増はなし。
マルチリージョンエンドポイント(us / eu)
Google Cloud が 2025 年に発表した新しいエンドポイント形式。動的ルーティングの柔軟性を保ちながら、データを特定の地域内に留められる。
| リージョン指定 | 対象エリア | エンドポイントURL |
|---|---|---|
us |
米国内の複数リージョン | aiplatform.us.rep.googleapis.com |
eu |
EU 域内の複数リージョン | aiplatform.eu.rep.googleapis.com |
料金はグローバルより 10% 割増となる。GDPR 対応など EU データ保護が必要なケース、または米国内にデータを留めたいケースに有効。
シングルリージョンエンドポイント
特定のリージョンに限定したい場合に使用する。利用可能なリージョンの例は以下のとおり。
| リージョン | 地域 |
|---|---|
us-east5 |
米国東部(オハイオ) |
us-central1 |
米国中部(アイオワ) |
europe-west1 |
欧州西部(ベルギー) |
europe-west4 |
欧州西部(オランダ) |
asia-southeast1 |
アジア東南部(シンガポール) |
シングルリージョンでもマルチリージョン同様に 10% の料金割増が発生する。また、Provisioned Throughput(事前確保スループット)はシングルリージョンでのみ利用できる。
日本向けの東京リージョン(asia-northeast1)は、Claude モデルが提供されていない場合があるため、アジア圏ではシンガポール(asia-southeast1)を利用するのが現時点での推奨となっている。
リージョン設定の実装方法
Python(AnthropicVertex SDK)
from anthropic import AnthropicVertex
# グローバルエンドポイント(デフォルト)
client = AnthropicVertex(project_id="MY_PROJECT_ID", region="global")
# マルチリージョン US
client = AnthropicVertex(project_id="MY_PROJECT_ID", region="us")
# マルチリージョン EU
client = AnthropicVertex(project_id="MY_PROJECT_ID", region="eu")
# シングルリージョン(例:米国東部)
client = AnthropicVertex(project_id="MY_PROJECT_ID", region="us-east5")
message = client.messages.create(
model="claude-opus-4-8@20250514",
max_tokens=1024,
messages=[{"role": "user", "content": "Hello"}],
)
TypeScript(@anthropic-ai/vertex-sdk)
import { AnthropicVertex } from "@anthropic-ai/vertex-sdk";
// マルチリージョン EU(GDPR 対応など)
const client = new AnthropicVertex({
projectId: "MY_PROJECT_ID",
region: "eu",
});
const message = await client.messages.create({
model: "claude-opus-4-8@20250514",
max_tokens: 1024,
messages: [{ role: "user", content: "Hello" }],
});
cURL
MODEL_ID=claude-opus-4-8@20250514
LOCATION=us # global / us / eu / us-east5 など
PROJECT_ID=MY_PROJECT_ID
# マルチリージョン US の場合、ホストが通常と異なる
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://aiplatform.us.rep.googleapis.com/v1/projects/${PROJECT_ID}/locations/${LOCATION}/publishers/anthropic/models/${MODEL_ID}:streamRawPredict \
-d '{
"anthropic_version": "vertex-2023-10-16",
"max_tokens": 1024,
"messages": [{"role": "user", "content": "Hello"}]
}'
グローバルや通常のシングルリージョンの場合は {LOCATION}-aiplatform.googleapis.com を使用する。
グローバル vs マルチリージョン vs シングルリージョンの比較
| 項目 | global | us / eu | 特定リージョン |
|---|---|---|---|
| データ保管場所 | 保証なし | 地域内に限定 | リージョン内に限定 |
| 料金 | 標準 | +10% | +10% |
| Provisioned Throughput | 非対応 | 非対応 | 対応 |
| 推奨ユースケース | 柔軟な要件 | EU/米国規制対応 | 厳格なデータ管理 |
ほとんどの開発・本番環境では global が最もコスト効率が高く、設定もシンプル。コンプライアンス要件がある場合に us や eu 、または特定リージョンに切り替えるという選択フローが自然だ。
データレジデンシーとコンプライアンス
欧州のサービスで GDPR に対応する場合、または米国の金融・医療規制でデータを国内に留める必要がある場合は、マルチリージョンまたはシングルリージョンの選択が必要になる。
- GDPR 準拠:
eu(またはeurope-west1など EU リージョン)を指定すれば、リクエストとレスポンスのデータが EU 内のサーバーのみで処理される - 米国内限定:
usを使用すれば、Google の米国内リージョン(us-central1やus-east4など)に限定してルーティングされる - VPC Service Controls: Vertex AI は VPC Service Controls と組み合わせることで、特定のネットワーク境界内からのみリクエストを許可する構成も可能。この場合はシングルリージョンでの設定が前提となる
グローバルエンドポイントは「どこかで処理される」状態であり、データがどの国のサーバーを通るかの保証がないため、データレジデンシー要件がある場合は必ず地域指定エンドポイントを使うこと。
料金への影響
Claude on Vertex AI 公式ドキュメント によると、マルチリージョンおよびシングルリージョンのエンドポイントを使用すると、グローバルエンドポイントの標準価格に対して 10% の割増が発生する。
例として Claude Sonnet 4.5 の場合、グローバルエンドポイントでのトークン単価に対し、us や eu では 1.1 倍の料金となる。
ただし、Claude 4 シリーズより前の一部モデルには既存の価格体系が適用されており、割増率が異なるケースがあるため、利用するモデルの料金ページで確認することを推奨する。
日本発のトラフィックで純粋にコストを抑えたい場合は global が最適。APAC リージョン(asia-southeast1)を選択すると 10% 割増かつレイテンシの改善効果も小さいため、グローバルとの使い分けはデータレジデンシー要件の有無で判断するのが合理的だ。
リージョンとモデルの可用性
すべてのリージョンで全モデルが利用できるわけではない。Google Cloud の Model Garden(console.cloud.google.com/vertex-ai/model-garden)で、対象プロジェクトのリージョンを指定しながらモデルの提供状況を確認できる。
新しいモデル(Claude Opus 4.8 など)が追加された直後は、グローバルや us-east5 では利用可能でも、他のリージョンでは提供されていないケースがある。Vertex AI 経由で最新モデルを試す際は、まず global または us-east5 で動作確認を行うのが確実だ。
まとめ
Vertex AI で Claude を使う際のリージョン選択は、データ保管の要件があるかどうかが判断軸になる。
- 要件なし →
globalでシンプルかつ低コスト - EU データ保護(GDPR 等) →
euマルチリージョン - 米国内限定 →
usマルチリージョン - 厳格な単一リージョン管理・Provisioned Throughput →
us-east5等シングルリージョン
設定は Python / TypeScript ともに region= パラメータ 1 箇所を変えるだけで切り替えられる。マルチリージョンエンドポイントは接続先のホスト名が変わる点に注意(aiplatform.us.rep.googleapis.com / aiplatform.eu.rep.googleapis.com)。コンプライアンス要件とコストのバランスを考慮しながら選択したい。