NVIDIAのGPUプロセスをリアルタイムでnvidia-smiよりもわかりやすく見せてくれるツール「nvitop」



NVIDIA GPUを利用する開発者や研究者にとって、NVIDIAのシステム管理インターフェイスである「nvidia-smi」コマンドはよく使うもの。しかし、「もっとインタラクティブにプロセスを管理したい」「情報をグラフィカルに把握したい」と感じることもあります「nvitop」は、情報をカラフルで分かりやすく表示するインターフェースが特徴で、単に一度情報を表示するだけでなく、リソースモニターとして継続的に情報を更新できます。



https://github.com/XuehaiPan/nvitop



https://nvitop.readthedocs.io/en/latest/



nvitopはnvidia-smiと同様の機能を持つだけでなく、カラフルで情報豊富なインターフェースを通じて、GPUの状態を継続的に更新し表示することができます。単なる監視にとどまらず、プロセスのフィルタリングやソート、ツリー表示、さらには他のプログラムから利用できるAPIの提供まで、GPU管理におけるワンストップソリューションとなることを目指して開発されています。





nvitopはnvidia-smiよりも多くの情報を、色分けされた見やすいボックス形式で表示します。GPUやメモリの使用率に応じて色が変わるため、システムの負荷状況を直感的に把握できます。





nvitopの最大の特徴は、継続的に情報を更新するモニターモードです。このモードでは、キーボードやマウスからの入力に反応し、プロセスのソート順を変更したり、特定のユーザーのプロセスのみをフィルタリングしたりすることが可能です。また、プロセスのツリー表示に切り替えることで、親子関係を確認しながらプロセスを安全に終了させることもできます。



特定のプロセスを選択してEnterキーを押すと、そのプロセスのCPU使用率やGPUメモリ使用率などの各種メトリクスが時系列グラフで表示されます。これにより、プロセスのリソース消費の動向を詳細に分析することが可能です。





nvitopはLinuxだけでなく、Windowsでも動作します。これにより、異なるOS環境でも一貫した操作性でGPUを監視できます。



また、nvitopには空いているGPUをメモリサイズや使用率といった条件に基づいて自動で選択してくれる「nvisel」というコマンドラインツールが付属しています。加えて、開発者が自身のアプリケーションにGPU監視機能を組み込むためのAPIも提供されており、高い拡張性を備えています。



nvitopはPythonで書かれており、pipで以下のコマンドを実行して簡単にインストールできます。



python3 -m venv venv



また、conda-forgeからcondaを使用してインストールすることも可能です。



conda install -c conda-forge nvitop



ただし、システムの環境を汚さないために、仮想環境にインストールすることが強く推奨されています。また、nvitopの動作にはPython 3.8以上と、NVIDIAディスプレイ ドライバまたはCUDA Toolkitに含まれるNVIDIA Management Library(NVML)が必要です。