アプリケーションを展開する

概要

KubernetesはGPUリソースをCPUリソースと同様に管理・使用します。ワーカーグループに選択したGPU構成に応じて、Kubernetes上でアプリケーションのGPUリソースを宣言してください。

注記:

  • Kubernetesは制限値をデフォルトのリクエスト値として使用するため、リクエストを指定せずに制限値のみを指定できます。

  • GPU制限と要求の両方を指定できますが、この2つの値は等しくなければなりません。

  • 制限を指定せずにGPU要求を指定することはできません。

  • 次のコマンドでGPU構成を確認します:

kubectl get node -o json | jq ‘.items[].metadata.labels‘

例:下の画像は、Nvidia A30カードを使用するワーカーを示しています。構成戦略:all-balanced、ステータス:success。

ワーカー上で以下のコマンドを使用してGPUインスタンス構成を確認してください

(ワーカーにSSH接続し、コマンドを入力):

GPUを使用したアプリケーションデプロイの例:

共有モードMIGおよびシングル戦略

GPUリソースは以下のように宣言されます:

シングルGPU戦略を用いたデプロイメント例

MIGおよび混合共有モードで

GPUリソースは以下のように宣言されます:

混合GPU戦略を用いたデプロイメント例

非戦略によって

GPUリソースは以下のように宣言されます:

非戦略を用いたデプロイメントの例

MPS共有モードで

GPUリソースは以下のように宣言されます:

注記: ポッドが要求できる nvidia.com/gpu リソースの最大数は 1 です。

Last updated