Serverless Inferenceでリージョンを手動選択できますか?

Q: Serverless Inferenceでリージョンを手動選択できますか?

A: 現在、Serverless Inference パッケージでは、処理リージョン (Region) の手動選択機能はサポートされておりません。

一般的なユーザー様のコストとパフォーマンスを最適化するため、当社のシステムはベトナム (VN) と日本 (JP) の2つのリージョン間でAPIリクエストを自動的に分散するように設計されています。

仕組みを理解し、ニーズに合ったサービスを選択するために、以下の比較表をご参照ください。

比較項目

Serverless Inference

Dedicated Inference

ルーティングの仕組み

Cross-Region Auto-routing (地域間自動ルーティング)

過負荷時にサービスの継続性を確保するため、自動的にリージョンを切り替えます (VN⇔JP)。

Fixed Region (固定リージョン)

お客様が最初に選択したリージョンに固定されます (例: VNのみで実行)。

データへのコミットメント

High Availability (高可用性)

可用性を優先します。ピーク時にはデータが他のリージョンで処理される可能性があります。

Data Residency (データ居住性)

データの場所を優先します。データが選択されたリージョンから出ないことを保証します。

推奨顧客

利便性とコストの柔軟性を求め、短期間の海外データ処理を許容できるお客様向け。

データの場所 (データ主権) に関する厳格な法的コンプライアンスが求められる政府機関や銀行向け。

プロジェクトに特定の処理リージョンへの固定要件 (例: データ居住コンプライアンスのためにベトナムでのみ実行する必要がある等) がある場合は、Dedicated Inference サービスへのアップグレードまたは切り替えをお願いいたします。

Last updated