[Linux CMD] NVIDIA System Management Interface (nvidia-smi)

Python으로 NVIDIA GPU를 사용하는 방법을 연습하다가, NVIDIA GPU의 Memory가 제대로 Release 되지 않는 문제가 발생하여 GPU를 Reset 해야 하는 경우가 발생했다. 인터넷을 찾다 보니 “nvidia-smi”라는 커맨드로 NVIDIA GPU의 현재 Status를 볼 수 있는 방법을 찾았다. 그림 1은 nvidia-smi 커맨드를 실행하면 나오는 GPU 정보들이다.

그림 1: “nvidia-smi” 커맨드 실행 화면

nvidia-smi은 다양한 Option 기능을 제공하는 듯하다. 우선 “nvidia-smi -h” 커맨드를 실행하면 아래 그림과 같이 nvidia-smi가 제공하는 기능들을 보여준다. 모든 기능 Output을 다 캡처할 수 없어서 가능한 부분만 캡처를 한 화면이다.

그림 2: “nvidia-smi -h” 커맨드 실행 화면

개인적으로 우선 NVIDIA GPU를 reset 하는 기능만을 사용해보았다. 그림 3은 “nvidia-smi” 커맨드를 사용하여 GPU 0을 Reset 한 화면이다.

그림 3: “nvidia-smi –gpu-reset –id=0” 커맨드 실행 화면

아직 다른 기능들은 사용해 보지 않아서 어떤 기능이 더 있는지 정확히 모르겠다. 사용하면서 유익하다고 판단되는 부분을 계속 업데이트할 예정이다.

Leave a Comment