# 概要

**データハブは、AI Studio** 内の集中型データ管理モジュールです。ユーザーは、AIモデルのライフサイクル全体（微調整、テスト、ベンチマークを含む）で使用される**データセットを保存、整理、バージョン管理、準備できます。**\
**モデル微調整やモデルテストなど**、他の AI Studio サービスとシームレスに統合することで、データハブデータセットの一貫性、追跡可能性、再利用性を確保します。

| 機能                  | 説明                                                                |
| ------------------- | ----------------------------------------------------------------- |
| **データセット管理**        | メタデータ（名前、説明、データ形式）とともにデータ&#xD;セットをアップロード、一覧表示、整理します。              |
| **セキュアストレージ**       | 構造化データおよび非構造化データ向けに、スケーラブ&#xD;ルで暗号化されたストレージを提供します。                |
| **データアクセス統合**       | 手動でのファイル操作なしに、微調整およびテストジョ&#xD;ブへの直接リンクをサポートします。                   |
| **事前署名済みURLアップロード** | 事前署名済みURLまたはAPIエンドポイントを通じて、大&#xD;規模データセットの効率的なアップロードを可能にしま&#xD;す。 |
| **検索とフィルタリング**      | 柔軟なフィルターを使用して、名前や作成日でデータセ&#xD;ットをすばやく検索できます。                      |

### サポートされるデータタイプ

Data Hubは、機械学習ワークフローで一般的に使用される幅広いファイル形式をサポートしています：

* **データ形式**：Alpaca、ShareGPT、ShareGPT\_Image、Corpus
* **構造化データ**：CSV、JSON、Parquet
* **テキストデータ**：TXT、JSONL
* **非構造化データ（任意）**：マルチモーダル微調整に使用する画像または文書

各データセットには、選択したトレーナーと互換性のある定義済み**スキーマまたはフォーマット**を含める必要があります。

### AI Studio全体での統合

Data Hubは、AI Studioの全モジュールにおける**データ基盤**として機能します：

| モジュー ル      | データハブの活用方法                                  |
| ----------- | ------------------------------------------- |
| **モデルの微調整** | 事前学習済みモデルのトレーニングや適応のためにデー&#xD;タセットにアクセスします。 |
| **モデルテスト**  | 検証用の評価データセットまたはベンチマークデータセッ&#xD;トを取得します。     |

この緊密な統合により、データセットからモデル、デプロイされたエンドポイントに至るまでの完全な系譜追跡が保証されます。

### アクセス方法

Data Hub には複数のインターフェースからアクセスできます：

1. **AI Studio コンソール** – データセットのアップロードと管理を行うWebベースのインターフェース。
2. **AI Studio API** – プログラムによるデータセット操作（アップロード、一覧表示、削除など）のための RESTful API。

### 典型的なワークフロー

1. データセットを**Data Hub**にアップロードします。
2. 識別しやすいように説明を追加します。
3. ファインチューニングまたはテストジョブを作成する際に参照してください。

### メリット

* &#x20;一元化され安全なデータ管理
* 自動化されたデータセットのバージョン管理と系譜追跡
* モデルトレーニングとテストのための高速アクセス
* チームやプロジェクト間の重複削減
* コンプライアンスと再現性の簡素化

### 次のステップ

* • データハブチュートリアルで**データセットのアップロードと整理方法を**学ぶ。  \
  • クイックスタートガイドで、データセットを使用した**モデルの微調整を**続行


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://ai-docs.fptcloud.com/ai-factory-guideline-jp/fpt-ai-studio/sbisu/dtahabu/gai-yao.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
