Ctrlk

✌️モデルの評価方法

実行履歴

実行履歴は、選択したモデルのすべてのテスト実行の詳細なログを提供します。

注意：履歴の各レコードには、ジョブが開始された時刻が表示されます

実行詳細

実行詳細ページでは、ファインチューニングジョブに関する包括的な概要を確認できます。これにはメタデータ、設定、メトリクスが含まれます。

以下を確認できます：

入力: テストの入力データ。例えば、質問応答タスクにおける質問。
Ground Truth: 各入力に対応する正解（ラベル）。予測結果との比較に使用される。
出力: モデルが入力に基づいて生成する回答。
メトリクス：出力とグラウンドトゥルースの比較に基づいて算出される指標。

Previousジョブの管理方法 Nextユーザートークン

Last updated 17 days ago