# データセットの生成方法

データセット生成機能では、事前学習済みモデル（教師モデル）を使用して、入力データから出力のラベル付けや生成を行う新しいデータセットを作成できます。モデル設定、入力データ、生成パラメータを指定する必要があります。

データハブサービスにアクセスし、データセット管理メニューに移動して「**データセット生成**」ボタンをクリックします

<figure><img src="https://fptcloud.com/wp-content/uploads/2025/07/image-1751971103513.32.30.png" alt=""><figcaption></figcaption></figure>

### ステップ1: 新しいモデル構成を選択または作成する

<figure><img src="https://fptcloud.com/wp-content/uploads/2025/07/image-1751971150903.38.58.png" alt=""><figcaption></figcaption></figure>

作成済みのモデル構成を選択するか、ドロップダウンリストをクリックして新規作成できます

* **モデルプロバイダー**：モデルプロバイダーとは、テキスト生成、ランキング、分類などのタスク向けにAIモ  デルを提供するサービスです。現在、**FPT AI Marketplace**と**OpenAI**をサポートしています
* **APIキー**：APIキーは、サービスへのアクセスを認証する一意のコードです
* **ベースURL**: モデルのベースエンドポイントURL。例:: `https://mkp-api.fptcloud.com/`
* **モデルタイプ**: AIモデルの機能を定義するモデルタイプを選択します。現在サポートされているのは  \
  LLM（大規模言語モデル）のみです
* **ベースモデル:** 基盤モデルを選択してください（例: DeepSeek-R1）。
* **モデル名**: 設定したいモデルの名称を指定してください

**ステップ2: パラメータの**

<figure><img src="https://fptcloud.com/wp-content/uploads/2025/07/image-1751971239430.40.21.png" alt=""><figcaption></figcaption></figure>

* **最大出力長**: モデルが生成できるトークンの最大数  生成できるトークンの最大数。デフォルト: `8192`.
* **Top-P**: トークンサンプリングの累積確率を制御します。値が大きいほど  多様性が増加します。デフォルト `0.95`.
* **温度**: 出力のランダム性を制御します。値が高いほど  創造的な応答を生成します。デフォルト: `1.00`.

**ステップ3: データセットの設定**

<figure><img src="https://fptcloud.com/wp-content/uploads/2025/07/image-1751971272483.41.01.png" alt=""><figcaption></figcaption></figure>

* **名前**（必須）：生成するデータセットの名前を入力してください。
* **トレーナー**: トレーナーの種類を選択します（例: SFT - 教師あり微調整）。
* **データ形式**: 入力データの形式を選択します。例: Alpaca
* **入力方法**: 入力データの提供方法を選択します。現在サポートされているのは**ファイルアップロードとデー  タ接続です**
* ァイルのアップ**ロード: \[ファイルのアップロード]** をクリッ `.csv` たは`.json` ファイルをアップロー  \
  ドします。

> 注: 最大ファイルサイズは 100MB です。
>
> * **データ接続**: 必要なデータ接続を選択し、有効なパスを入力してください

* システム**メッセージ**（任意）：モデルのバックグラウンドプロンプト。例：`"You are a helpful assistant."`

必須項目を入力後、「保存」ボタンをクリックしてください。ファイルサイズやモデルの応答時間により、生\
成に数分かかる場合があります。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://ai-docs.fptcloud.com/ai-factory-guideline-jp/fpt-ai-studio/sbisu/dtahabu/chtoriaru/dtasettono.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
