🚀デプロイメント(LoRA推論)

ファインチューニング済みLoRAモデルのデプロイ方法

ユーザーストーリー: ユーザーとして、インフラ管理なしでAPI経由ですぐに利用できるよう、ファインチューニング済み LoRAモデルをデプロイしたい。

手順

  1. ナビゲーションバーから「デプロイメント」ページに移動します。

    • または、ファインチューニング後の成功ポップアップから「デプロイを表示」をクリックします 。

  1. デプロイしたいLoRAモデルの横にある「デプロイ」をクリックしてください。

    • ステータスが「デプロイ中」に変わります。

  2. デプロイが成功すると、ステータスは「デプロイ済み」と表示されます。


デプロイ済みモデルの管理方法

デプロイメントページでは以下の操作が可能です:

• APIキーを取得–モデルを呼び出すためのキーを取得します。 • APIリクエストの表示–サンプルJSONレスポンスを含むポップアップを開きます。 • プレイグラウンドで試す–UI上で直接モデルをテストします。 • アンデプロイ – デプロイされたモデルの停止(確認が必要)。

ステータスバッジ

• デプロイ中–モデルがデプロイ中です。 • デプロイ済み –モデルは推論の準備が整っています。 • 停止済み–モデルのデプロイが解除されました。 • 失敗 –デプロイに失敗しました。

Last updated