✌️モデルの評価方法

実行履歴

実行履歴は、選択したモデルのすべてのテスト実行の詳細なログを提供します。

注意:履歴の各レコードには、ジョブが開始された時刻が表示されます

実行詳細

実行詳細ページでは、ファインチューニングジョブに関する包括的な概要を確認できます。これには メタデータ、設定、メトリクスが含まれます。

以下を確認できます:

  • 入力: テストの入力データ。例えば、質問応答タスクにおける質問。

  • Ground Truth: 各入力に対応する正解(ラベル)。予測結果との比較に使用される。

  • 出力: モデルが入力に基づいて生成する回答。

  • メトリクス:出力とグラウンドトゥルースの比較に基づいて算出される指標。

Last updated