✌️モデルの評価方法

プレイグラウンド

プレイグラウンドは、ユーザーがチャット形式でAIモデルとやり取りできる空間です。メッセージのテスト、モデルの応答評価、モデル動作の調整を目的としています。

以下の手順でモデルを評価できます：

パラメータの調整

パラメータには以下が含まれます：

名前

説明

型

サポートされる値

温度

アシスタントの応答におけるランダム性を制御します。低い = より焦点が絞られる高く = 創造性豊か。

浮動小数点

[0.00, 2.00] （一般的に1.00がバランスが良い）

停止シーケンスを追加

モデルがテキスト生成を停止すべき位置を定義します。

文字列

カスタム文字列

出力の長さ

応答のトークン数を制限します。

整数

[0, 8192]

Top-P

核サンプリングによる多様性を制御します。低い値 = より集中した結果

浮動小数点

(0.00, 1.00]

目的ごとにパラメータを調整することを推奨します：

目的

温度

ストップ追加シーケンス

出力長さ

Top-P

クリエイティブライティング

1.0–1.5

500+

0.8–1.0

技術的な説明

0.2–0.5

200–500

0.3–0.6

要約

0.2–0.5

150–300

0.3–0.6

コード生成

0.1–0.4

“n” or “#”

0.3–0.6

会話型エージェント

0.7–1.0

200–600

0.8–1.0

チャット開始

プレイグラウンドのインターフェースは、以下の要素を含む「コンプリート」を中心に構成されています：

プロンプト

説明

システムメッセージ

アシスタントの行動と口調を定義します。これは会話全体を通じてモデルがどのように応答するかを導くのに役立ちます。例：あなたは創造的なライティングアシスタントです。常に鮮やかなイメージ、感情的な深み、物語を語るような口調で書いてください。

ユーザーメッセージ

あなたからの入力またはクエリを表します。LLM モデルをテストするにはテキストを入力するか、 VLMモデルをテストするには画像をアップロードできます。

アシスタントの応答

AIモデルの応答は、ユーザーメッセージとシステムメッセージに基づいています。

モデルとリアルタイムでやり取りし、その応答を観察し、目標に基づいて反復できます。

プロンプトを洗練させる

異なる挙動の改善や探索には：

システムメッセージを変更して、アシスタントの性格や口調を変更してください。
ユーザーメッセージを調整して、異なる種類のクエリをテストしてください。
パラメータを微調整してモデルの出力変化を観察する。

クリア完了

クリアアイコンをクリックしてリセットし、新しい補完を開始します。
完了をクリアすると、その完了は終了し、完了履歴に保存されます。

完了履歴

完了履歴では、過去の完了内容を確認・管理できます。過去のメッセージ、返信、セッションの詳細を追跡し、確認や再利用に役立ちます。

完了履歴へのアクセス方法

インターフェースの「完了履歴」タブに移動します。このページには、現在および過去のすべての完了リストが表示されます。
リストを閲覧するか、検索バーを使用して特定の完了履歴を検索できます：

最後のアシスタント応答に含まれるキーワード

完了詳細の表示

1つの補完をクリックすると展開されます。
以下が表示されます：

ユーザーメッセージ
アシスタントの応答
完了の所要時間
発生時刻

完了の継続

過去の完了を再開するには、[続行]ボタンをクリックしてください。
これにより Playground が再開され、モデルとのチャットを継続できます。

完了の削除

履歴から完了を削除するには：

ゴミ箱アイコンまたは削除ボタンをクリックしてください。
削除を確認する確認ポップアップが表示されます

注意：削除した完了データは完全に削除され、復元できません。

すべての補完履歴をダウンロード

完了履歴全体をエクスポートするには：

ダウンロードボタンをクリック
対応ファイル形式は「.xlsx」です。各完了データには、ユーザーメッセージ、アシスタント応答、タイムスタンプ、メタデータが含まれます
（任意）開始アイコンをクリックし「My pick」に移動して選択した完了をダウンロード

Previousセッションの管理方法 Nextモデルの統合方法

Last updated 22 days ago