✌️​​コンテナの監視方法​ ?

GPUコンテナは、ワークロードの監視とトラブルシューティングを支援するコンテナログとメトリクスを提供します。ログとメトリクスを表示するには、コンテナの詳細画面を開き、「ログ」または「監視」タブを選択します。これによりコンテナログとメトリクスの監視が可能になり、問題の診断やコンテナのアクティビティ監視が容易になります。

コンテナログ

コンテナログにはすべてのアプリケーションログが含まれます。ログは14日間のみ保持され、タイムスタンプはUTCタイムゾーンで表示されることに注意してください。

  1. ダウンロード: コンテナの過去14日間のログをダウンロードします。

  2. 検索: ログ内容内で検索するキーワードを入力します。

  3. 時間フィルター: 特定の時間範囲でログをフィルタリングします。

  4. 更新間隔: コンテナログが自動的に更新される間隔。

メトリック監視

メトリクス監視は、コンテナ化されたサービスのパフォーマンス、可用性、リソース使用状況を追跡するために収集され、問題の検出と運用の最適化に役立ちます。メトリクスデータは14日間保持されます。

4つのメトリックグループがあります:

  • 利用率メトリクス:CPU、メモリ、GPUの使用率を監視し、システムパフォーマンスとリソース効率を評価します。

  • ディスクメトリクス:ディスクの読み取り/書き込み速度とレイテンシを追跡し、ストレージの問題やボトルネックを検出します。

  • ネットワークメトリクス:ネットワークトラフィック、レイテンシ、エラーを測定し、接続問題を特定してサービスの信頼性を確保します。

  • 温度と電力メトリクス:ハードウェアの温度と消費電力を監視し、過熱を防止しハードウェアの健全性を維持します。

  1. 時間フィルター: 特定の時間範囲でメトリクスをフィルタリングします。

  2. 更新間隔:コンテナメトリクスが自動的に更新される間隔。

Last updated