✌️モデルの評価方法
実行履歴
実行履歴は、選択したモデルのすべてのテスト実行の詳細なログを提供します。

注意:履歴の各レコードには、ジョブが開始された時刻が表示されます
実行詳細
実行詳細ページでは、ファインチューニングジョブに関する包括的な概要を確認できます。これには メタデータ、設定、メトリクスが含まれます。

以下を確認できます:
入力: テストの入力データ。例えば、質問応答タスクにおける質問。
Ground Truth: 各入力に対応する正解(ラベル)。予測結果との比較に使用される。
出力: モデルが入力に基づいて生成する回答。
メトリクス:出力とグラウンドトゥルースの比較に基づいて算出される指標。
Last updated
