✌️パイプラインの作成方法

1

ステップ1

  • ベースモデルを選択:

    • モデルカタログ(例:DeepSeek、Gemma、Llama、Qwen)またはプライベートモデルリポジ トリから基盤モデルを選択してください。モデルはサイズ(0.5B~72Bパラメータ)、タイプ (LLM、VLM)、トレーニング段階(事前学習済みまたは指示学習済み)によって異なります 。

  • トレーナーの選択:

    • タスクとデータタイプに応じて、SFT(教師あり微調整)、DPO(直接嗜好最適化)、または 事前学習などのトレーニング手法を選択してください。

  • ボリュームを選択:

    • データセットのサイズに基づいてストレージタイプを選択してください:20GiB未満のデータ セットにはマネージドボリュームを、手動プロビジョニングが必要なより大きなデータセッ トには専用ネットワークボリュームを使用します。

2

ステップ2

  • データセット形式を選択:

    • 選択したトレーナーに応じて適切な形式(Alpaca、ShareGPT、Corpusなど)を選択してくだ さい。

  • データセットの選択:

    • トレーニング用および評価用データセットをアップロードするか、Data Hubに接続してくださ い。モデルの性能を最適化するため、データの品質、一貫性、正しいフォーマットを確認し てください。

3

ステップ3

  • ハイパーパラメータの設定:

    • バッチサイズ、学習率、エポック数、オプティマイザー設定などのトレーニングパラメータを 設定します。DPO、LoRA、実行時最適化のための高度なオプションが利用可能です。

  • インフラストラクチャの設定:

    • シングルノードとマルチノードの両方をサポートし、最大16ノードまで対応

4

ステップ4

  • 完了:

    • パイプラインに名前を付け、必要に応じて説明を追加します。パイプラインの成功また は失敗時にメール通知を受け取ります

Last updated