# 10. 管理対象GPUクラスター構成

マネージド GPU クラスター 製品は、Kubernetes Native から開発され、FPT CLOUD Controller Manager を含むクラウドプロバイダのコンポーネントが Kubernetes に追加統合されています。このコンポーネントは、クラスター内のワーカーノードとロードバランサー形式のサービスを管理することを目的としています。ユーザーは、インターネット上にアプリケーションを公開し、そのアプリケーションやサービスに顧客がアクセスできるようにする方法をいくつか利用できます。その方法としては、サービスへのイングレッセの作成、ノードポート形式のサービスの作成とワーカーノードへのフローティングの割り当て、あるいはロードバランサー形式のサービスの使用などが考えられます。

FPT CLOUD は、サービス設定の注釈付きオプションを使用して、ロードバランサー形式のサービスを作成することをサポートしています。

サービス設定で：

| キー                                                                  | 値                                                                                                              | デフォルト                         | 目的                                                                                                                                    |
| ------------------------------------------------------------------- | -------------------------------------------------------------------------------------------------------------- | ----------------------------- | ------------------------------------------------------------------------------------------------------------------------------------- |
| <p>service.beta.kubernetes.io/fpt-load-balancer-</p><p>internal</p> | "true"/"false"                                                                                                 | "false"                       | サービスをインターネットに公開したくない場合は、値を「true」に設定してください。                                                                                            |
| loadbalancer.fptcloud.com/keep-floatingip                           | "true"/"false"                                                                                                 | "false"                       | LoadBalancer サービスのフローティング IP を、そのサービスを削除した後も VPC 内に残したい場合は そのサービスを削除した後も、そのサービスのフローティング IP を VPC 内に保持したい場合は、値を「true」に設定してください。        |
| loadbalancer.fptcloud.com/proxy-protocol                            | loadbalancer.fptcloud.com/proxy-protocol                                                                       | "false"                       | LoadBalancer でプロトコル PROXY を使用したい場合は、値を「true」に設定してください。 注意：プロキシプロトコルは、LoadBalancer layer4 でのみ使用されます。                                   |
| loadbalancer.fptcloud.com/enable-health-monitor                     | "true"/"false"                                                                                                 | "true"                        | LoadBalancer Pool のヘルスモニターを無効にするには、値を「false」に設定してください。                                                                                |
| service.beta.kubernetes.io/fpt-load-balancer-type                   | LBv1 には、basic/ advanced/ standard/ premium が含まれます。LBv2 には、Basic-1/ Basic-2/ Standard/ Advanced/Premium が含まれます。 | Lbv1: "basic" LBv2: 「Basic-1」 | LoadBalancer のフレーバー設定は、LoadBalancer プールのバックエンドにあるアプリケーションの負荷に対応するように設定します。                                                            |
| <p>loadbalancer.fptcloud.com/enable-ingress-</p><p>hostname</p>     | "true"/"false"                                                                                                 | "false"                       | LoadBalancer サービスタイプの ingress hostname を有効にするには、値を「true」に設定してください。                                                                    |
| loadbalancer.fptcloud.com/load-balancer-version                     | "v1"/"v2"                                                                                                      | "v1"                          | <p><br></p><p>LoadBalancerサービスタイプでLBv2を使用するには、値を「v2」として設定してください。このアノテーションを設定しない場合、デフォルトでLBv1が作成されます。</p>                              |
| loadbalancer.fptcloud.com/x-forwarded-for                           | "true"/"false"                                                                                                 | "false"                       | LoadBalancer layer7 を使用する場合、リクエストのヘッダーを LoadBalancer プールバックエンドに転送するには、値を「true」に設定します。 注意：プロキシプロトコルと x-forwarded-for を同時に使用することはできません。 |

また、マネージド GPU クラスターでは、ユーザーが以下を設定できます。

**LoadBalancer に割り当てられた floatingIP を指定する LoadBalancer サービスタイプを作成します。**

<figure><img src="/files/Lpi3gnUVTlOKrUiDXBZx" alt=""><figcaption></figcaption></figure>

<figure><img src="/files/6s26gFdDIN2CqhvFTgvJ" alt=""><figcaption></figcaption></figure>

#### 注意：パブリック IP は VPC に割り当てられ、非アクティブの状態である必要があります。ユーザーは**ネットワーク-> フローティングIP**で確認してください。

サービス設定&#x306E;**「spec」**&#x30BB;クションにあ&#x308B;**「loadBalancerSourceRanges」**&#x3092;使用して制限します。

<figure><img src="/files/u8p55F9xten2lqfD1sEo" alt=""><figcaption></figcaption></figure>

* 14.233.234.0/24
* 10.250.0.0/24

#### 注：「loadBalancerSourceRanges」設定には、ロードバランサーへのアクセスが許可されているパブリック IP アドレスの範囲の配列が含まれています。デフォルトでは、M-FKE は、ソース IP アドレスの範囲が 0.0.0.0/0 のロードバランサーのサービスタイプを作成します。

Ollama は、個人用コンピュータやサーバー上で大規模言語モデル (LLM) を実行、管理、カスタマイズできるオープンソースのツールであり、Llama、DeepSeek、Mistral などのさまざまなモデルをサポートしています。 .............Open-WebUI は、Ollama と連携するために特別に設計されたオープンソースの Web インターフェースで、LLM モデルの管理と使用をユーザーフレンドリーで簡単に体験できます。

Ollama と連携し、LLM モデルの管理と使用において、ユーザーフレンドリーで簡単な操作性を提供します。

このドキュメントでは、Ollama と Open-WebUI を使用して DeepSeek-R1 モデルを FPT マネージド GPU クラスター に実装する手順を説明します。これにより、ユーザーは簡単かつ簡単に使用することができます。

{% stepper %}
{% step %}
**ステップ 1：**&#x4F;pen-WebUI の既存のソースコードとスクリプトをクローンする

```
> git clone https://github.com/open-webui/open-webui
> cd open-webui/kubernetes
```

{% endstep %}

{% step %}
**ステップ 2：**&#x30B9;クリプトを実行して ollama と open-webui をデプロイします。 ディレクトリ内には、**namespace、ollama statefulSet、ollama service、open-webui deployment、open-webui service** など、デプロイに必要なすべてのファイルが含まれています。

```
> cd kubernetes
> kubectl apply -f ./kubernetes/manifest
```

{% endstep %}

{% step %}
**ステップ 3:** ブラウザで、転送されたポート（例：[http://localhost:52433](http://localhost:52433/)）の open-webui にアクセスします。OpenWebUI を初めてインストールして使用する場合、ユーザーは、名前、メールアドレス、パスワードなどの情報を設定する必要があります。

<figure><img src="/files/QROmKng9PPCpU5m09qY1" alt=""><figcaption></figcaption></figure>
{% endstep %}

{% step %}
**ステップ 4：**&#x30A4;ンストールが完了したら、ユーザーは使用するモデルを選択します。ここでは、DeepSeek-R1 モデル、バージョン **1.5b** をインストールします。

<figure><img src="/files/PKc9Uc3m7CHGBuZAGIjJ" alt=""><figcaption></figcaption></figure>
{% endstep %}

{% step %}
**ステップ5：**&#x30E2;デルが読み込まれて実行された後、ユーザーはインターフェースを通じて非常にシンプルかつ直感的にモデルと対話できます。

<figure><img src="/files/ZMCGS0fGq2yY8dsbxTsT" alt=""><figcaption></figcaption></figure>
{% endstep %}
{% endstepper %}


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://ai-docs.fptcloud.com/ai-factory-guideline-jp/fpt-gpu-cloud/gpu-cluster/gpu-cluster-managed-k8s-with-metal-cloud/chtoriaru/10-gpukurasut.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
