アプリケーションを展開する
概要
KubernetesはGPUリソースをCPUリソースと同様に管理・使用します。ワーカーグループに選択したGPU構成に応じて、Kubernetes上でアプリケーションのGPUリソースを宣言してください。
注記:
Kubernetesは制限値をデフォルトのリクエスト値として使用するため、リクエストを指定せずに制限値のみを指定できます。
GPU制限と要求の両方を指定できますが、この2つの値は等しくなければなりません。
制限を指定せずにGPU要求を指定することはできません。
次のコマンドでGPU構成を確認します:
kubectl get node -o json | jq ‘.items[].metadata.labels‘
例:下の画像は、Nvidia A30カードを使用するワーカーを示しています。構成戦略:all-balanced、ステータス:success。

ワーカー上で以下のコマンドを使用してGPUインスタンス構成を確認してください
(ワーカーにSSH接続し、コマンドを入力):
GPUを使用したアプリケーションデプロイの例:
共有モードMIGおよびシングル戦略
GPUリソースは以下のように宣言されます:
シングルGPU戦略を用いたデプロイメント例
MIGおよび混合共有モードで
GPUリソースは以下のように宣言されます:
混合GPU戦略を用いたデプロイメント例
非戦略によって
GPUリソースは以下のように宣言されます:
非戦略を用いたデプロイメントの例
MPS共有モードで
GPUリソースは以下のように宣言されます:
注記: ポッドが要求できる nvidia.com/gpu リソースの最大数は 1 です。
Last updated
