へっぽこプログラマーの備忘録
プログラムを中心とした個人的なメモ用のブログです。 タイトルは迷走中。
内容の保証はできませんのであしからずご了承ください。
menu
keyboard_arrow_up
Top
search
close
home
ホーム
computer
PC一般
construction
開発環境・ツール
code
プログラミング
home
ホーム
computer
PC一般
construction
開発環境・ツール
code
プログラミング
Home
›
Telegraf
›
Telegraf で GPU の情報を取得し、Grafana で可視化する
2021/12/26
Telegraf で GPU の情報を取得し、Grafana で可視化する
update
event_note
label
Docker
label
Grafana
label
InfluxDB
label
Telegraf
Telegraf, InfluxDB, Grafana を使って GPU の情報を閲覧できるようにしました。
以前、Telegraf, InfluxDB, Grafana を使ってサーバーリソースの情報を閲覧できるようにしました。 - https://kuttsun.blogspot.com/2021/12/telegraf-influxdb-garafana.html これを前提としたうえで、今回 GPU の情報も見れるようにしました。 試したグラフィックボードは NVIDIA GeForce RTX 3080 です。 グラフィックドライバーのインストールなどは完了している前提です。 ## 概要 Telegraf の nvidia_smi プラグインを使えば GPU の情報を取得できるようです。 nvidia_smi のプラグインについては以下に説明があります。 - https://github.com/influxdata/telegraf/blob/master/plugins/inputs/nvidia_smi/README.md 上記の記事に書いてありますが、Docker で動作させている Telegraf で GPU の情報を取得するには、以下の2つの方法があるようです。 - `nvidia/cuda` の Docker イメージをベースに Telegraf をインストールしたカスタムイメージを作成する - Volume のマウントバインディングを使用して nvidia-smi のバイナリを Docker コンテナに注入する 今回は後者でいきます。 ## Telegraf の設定 `telegraf.conf` に以下を追加しました。 ``` [[inputs.nvidia_smi]] #bin_path = "/usr/bin/nvidia-smi" ``` `inputs.nvidia_smi` を追加するだけでプラグインが有効になるようです。 `bin_path` は `nvidia-smi` のある場所です。 以下のコマンドで調べられます。 ``` $ which nvidia-smi /usr/bin/nvidia-smi ``` Linux では通常 `/usr/bin/nvidia-smi` にあるそうで、その場合は指定しなくてもよいそうです。 ## docker-compose の設定 Telegraf を動作させている Docker コンテナから nvidia-smi と GPU にアクセスできるように設定します。 例えば、以下のような感じです。 ``` version: '3.5' services: telegraf: container_name: telegraf image: telegraf environment: - NVIDIA_VISIBLE_DEVICES=all - NVIDIA_DRIVER_CAPABILITIES=all deploy: resources: reservations: devices: - capabilities: [gpu] volumes: - ./telegraf.conf:/etc/telegraf/telegraf.conf:ro - /usr/bin/nvidia-smi:/usr/bin/nvidia-smi:ro ``` ホストの `/usr/bin/nvidia-smi` をコンテナにマウントします。 Docker コンテナでの GPU の使用については以下の記事にも書いているので、参照してください。 - https://kuttsun.blogspot.com/2021/11/docker-compose-gpu.html ## Grafana の設定 Docker コンテナを起動したら、Grafana で以下のダッシュボードのテンプレートをインストールします。 - https://grafana.com/grafana/dashboards/12225 これで閲覧できるようになると思ったのですが、`Hostname` に `None` しか表示されず、グラフに何も表示されない状態でした。 どうもこのテンプレートが Windows を前提としているようですので、ダッシュボードの設定をちょっと修正しました。 ダッシュボードの設定画面を開き Variables を選択します。 `hostname` の定義を以下のように変更します。 **変更前** ``` SHOW TAG VALUES FROM "win_system" WITH KEY = "host" ``` **変更後** ``` SHOW TAG VALUES FROM system WITH KEY=host ``` これで以下のようにグラフが表示されるようになりました。
他に `CPU Usage` と `Memory Free` のメーター表示も Windows 前提となっているようなので、必要なら修正してください。 私は CPU やメモリなどは他のダッシュボードで閲覧しており、ここでは GPU の情報だけで十分だったので、そこまで修正しませんでした。
## 参考 URL - https://github.com/influxdata/telegraf/blob/master/plugins/inputs/nvidia_smi/README.md - https://cristianpb.github.io/blog/grafana-dashboard
tweet
facebook
Pocket
B!
はてブ
LINE
chevron_left
chevron_right
Translate
Popular Posts
TortoiseGit でコミットメッセージを変更する
image
NO IMAGE
smbclient で session setup failed: NT_STATUS_LOGON_FAILURE が表示される
Docker for Windows の設定
image
NO IMAGE
マージ元ブランチとマージ先ブランチ
image
NO IMAGE
TortoiseSVN ロック状態のチェック
image
NO IMAGE
Visual Studio で文字がにじむ(ぼやける)
TortoiseGit でブランチ間の差分を見る
image
NO IMAGE
AsciidocFX をビルドする
image
NO IMAGE
PowerShellでブレークポイントが設定できない場合
[Python] 文字列の判定で、None と空文字を同時に判定する
Labels
.NET Core
31
.NET Framework
17
.NET Standard
2
AdminLTE
1
AI
1
Apache
3
AppVeyor
2
AsciiDoc
7
ASP.NET Core
55
Atom
4
AWS
5
AWS Cloud9
4
blockdiag
1
Blogger
13
Bootstrap
3
C/C++
6
C#
106
CentOS
3
Chrome
1
Chronograf
3
chrony
1
Codecov
1
CSS
1
Docker
80
DokuWiki
4
Doxygen
1
draw.io
1
EasyTag
1
Electron
1
Electron.NET
2
Entity Framework Core
9
Excel
2
FFmpeg
3
Firefox
6
Flask
1
Git
19
GitBook
4
GitBucket
7
GitHub
7
GitLab
39
Go
1
Google
1
Google Cloud Platform
1
Grafana
13
GStreamer
2
HTML
5
IIS
8
InfluxDB
14
JavaScript
15
Jekyll
2
Jenkins
7
Linux
34
Log4View
1
MahApps.Metro
3
MaterialDesignInXamlToolkit
1
MkDocs
2
MongoDB
5
MVC
1
MVVM
6
nginx
3
NLog
3
Node.js
8
npm
1
NVIDIA
3
onvif
1
OpenAPI
2
OpenCV
4
OpenSSL
3
OpenVINO
2
ownCloud
2
pandas
1
Pine Script
1
PlantUML
5
Portainer
3
PowerShell
8
Prism
2
PySide
19
Python
88
PyTorch
1
RabbitVCS
1
Razor
3
redis
1
Redmine
33
Redoc
1
remark.js
2
rocketchat
10
Ruby
3
scikit-learn
1
shotcut
1
SignalR
1
Slack
1
Socket.IO
1
SonarQube
5
Sphinx
10
SQL Server
5
SQLite
1
StableDiffusion
1
Subversion
2
Swagger
1
Swarmpit
1
Syslog
3
Telegraf
6
Tesseract
3
TestLink
2
Tomcat
2
TortoiseGit
11
TortoiseSVN
2
Trading View
1
Traefik
3
Travis CI
1
Ubuntu
31
Visual Studio
39
Visual Studio Code
10
VSCode
8
Vue.js
8
Windows
62
Windows 10
5
Windows ADK
1
Windows API
2
Windows Embedded
4
wkhtmltopdf
2
Word
3
WPF
12
WSL
5
WSL2
5
Xamarin
1
xUnit
5
yaml
1
yolo
1
アプリケーション
1
デザインパターン
1
テスト
1
バッチファイル
2
プログラミング
4
ライセンス
1
暗号資産(仮想通貨)
1
英語
2
確定申告
1
機械学習
1
強化学習
1
雑記
1
書籍
1
数学
1
正規表現
1
動画編集
1
Blog Archive
►
2024
(18)
►
9月
(5)
►
8月
(1)
►
7月
(2)
►
6月
(1)
►
4月
(2)
►
3月
(1)
►
2月
(5)
►
1月
(1)
►
2023
(30)
►
12月
(3)
►
11月
(5)
►
10月
(2)
►
9月
(1)
►
8月
(2)
►
7月
(4)
►
6月
(2)
►
5月
(3)
►
4月
(2)
►
3月
(2)
►
2月
(3)
►
1月
(1)
►
2022
(106)
►
12月
(5)
►
11月
(1)
►
10月
(3)
►
9月
(6)
►
8月
(7)
►
7月
(6)
►
6月
(13)
►
5月
(9)
►
4月
(15)
►
3月
(11)
►
2月
(14)
►
1月
(16)
▼
2021
(85)
▼
12月
(11)
Telegraf で GPU の情報を取得し、Grafana で可視化する
[Python] Docker コンテナ内のアプリのログをホストの Syslog に追加する
[Python] Flask (Werkzeug)のロギングの設定
rsyslog から Telegraf への送信に時々失敗する
[Python] コンソールに出力するログに色を付ける
[Python] ロギングの個人的ベストプラクティス
Syslog を Telegraf に送り、Grafana で閲覧できるようにする
Telegraf + InfluxDB + Garafana でサーバーリソースを可視化する
docker デーモンが勝手に再起動する原因の調査と対策
[Python] 指定したディレクトリ内の空ディレクトリを全て削除する
Docker のディスク使用量を調べる
►
11月
(6)
►
10月
(4)
►
9月
(10)
►
8月
(8)
►
7月
(4)
►
6月
(18)
►
5月
(7)
►
4月
(8)
►
3月
(2)
►
2月
(2)
►
1月
(5)
►
2020
(56)
►
12月
(1)
►
11月
(3)
►
10月
(3)
►
9月
(3)
►
8月
(3)
►
7月
(7)
►
6月
(7)
►
5月
(2)
►
4月
(6)
►
3月
(6)
►
2月
(3)
►
1月
(12)
►
2019
(92)
►
12月
(13)
►
11月
(9)
►
10月
(3)
►
9月
(2)
►
8月
(3)
►
7月
(5)
►
6月
(11)
►
5月
(6)
►
4月
(17)
►
3月
(9)
►
2月
(6)
►
1月
(8)
►
2018
(100)
►
12月
(1)
►
11月
(11)
►
10月
(8)
►
9月
(6)
►
8月
(10)
►
7月
(10)
►
6月
(8)
►
5月
(9)
►
4月
(8)
►
3月
(14)
►
2月
(4)
►
1月
(11)
►
2017
(117)
►
12月
(14)
►
11月
(20)
►
10月
(17)
►
9月
(19)
►
8月
(10)
►
7月
(8)
►
6月
(3)
►
5月
(6)
►
4月
(5)
►
3月
(2)
►
2月
(8)
►
1月
(5)
►
2016
(91)
►
12月
(5)
►
11月
(9)
►
10月
(11)
►
9月
(9)
►
8月
(6)
►
7月
(14)
►
6月
(14)
►
5月
(11)
►
4月
(10)
►
3月
(2)
►
2015
(23)
►
12月
(4)
►
11月
(2)
►
10月
(8)
►
9月
(8)
►
7月
(1)
►
2013
(3)
►
11月
(1)
►
9月
(1)
►
7月
(1)
►
2012
(2)
►
7月
(1)
►
6月
(1)
►
2011
(1)
►
9月
(1)
►
2009
(1)
►
7月
(1)
►
2008
(2)
►
11月
(1)
►
7月
(1)
►
2007
(3)
►
10月
(3)