研究開発で使える docker / GPU ユーティリティ
TL;DR
Docker Web UI
portainer
- GUI から container の run/stop や,リソースの監視ができる
- 無論portainer 自体も docker で立てられる
- portainer以外にも色々あるので好きなのを選ぶと良い
Docker TUI
Docker Image 削減
Docker command completion
- まずは公式
- (peco のシェル履歴で事足りることも多いが) 補完ツールも色々ある
GPU monitoring
nvidia-smi (official)
$ nvidia-smi --help-query-gpu
で取得可能な metrics 一覧がみれる- オレオレ監視ツールを自作するのも良いでしょう
$ nvidia-smi --format=noheader,nounits,csv --query-gpu=utilization.gpu,utilization.memory,temperature.gpu,fan.speed,memory.total,memory.used,memory.free $ 0,0,34,0,11169,0,11169
- 余談だが NVML には Go bindings があったりもする.
まとめ
- docker 関係のツールは CPUリソース監視がメイン
- コンテナのGPUリソースも監視したければ自分で書く必要がある
- おすすめがあったら教えてください.