h3solution
NautiVision

GPU 인프라 모니터링
실시간으로 깊게

nautivision.local
Loading demo…
노드 모니터링

서버 단위
가장 깊은 곳까지

운영 핵심 지표를 한 화면에 통합한 대시보드
서버별 CPU 온도, GPU 클록, 전력 사용량, 팬 RPM까지 실시간으로 추적

GPU-SRV-03
Online
OSUbuntu 22.04 LTS
CPUIntel Xeon W-3375
Core38C / 76T
Memory256GB ECC
GPUNVIDIA RTX 4090 ×4
CUDA12.4
CPU
58%
67°C · 182W
GPU
84%
79°C · 1368W
Memory
182.4GB
of 256GB ECC
Power
1450W
CPU + GPU combined
TICK
10:30 · CPU 58% · GPU 84%
GPU Usage
2s live
CPU Usage
2s live
RTX 4090
GPU 0
91%
79°C348W22.3 / 24GB VRAM
RTX 4090
GPU 1
88%
77°C341W21.8 / 24GB VRAM
RTX 4090
GPU 2
84%
75°C334W20.7 / 24GB VRAM
RTX 4090
GPU 3
82%
74°C329W19.9 / 24GB VRAM
GPU Usage
2s live
CPU Usage
2s live
실시간 수집

2초마다
지연 없이

경량 에이전트 기반 2초 단위 실시간 수집
이상 징후 발생 시 그래프와 수치 변화로 즉시 확인 가능

TICK
10:30 · CPU 58% · GPU 84%
상세 지표

필요한 지표를 빠짐없이

온도와 전력만 보는 수준을 넘어, PCIe 대역폭, VRAM 사용량, 팬 RPM, NVLink 상태까지 확인 가능
한 노드에서 20개 이상의 지표를 실시간 수집

CPU
  • Package Temp
  • Core Temp (per core)
  • Core Voltage
  • Core Clock
  • Power (W)
  • Utilization (%)
GPU
  • Core Temp
  • Hotspot Temp
  • Memory Temp
  • Core Clock (MHz)
  • Memory Clock
  • Utilization (%)
  • Fan RPM
  • Throttle State
  • ECC Errors
Memory & Storage
  • System RAM Used / Total
  • GPU VRAM Used / Total
  • GPU Power Usage (W)
  • PCIe RX Bandwidth
  • PCIe TX Bandwidth
  • NVLink Bandwidth
System
  • T-Sensor (°C)
  • Driver Version
  • CUDA Version
  • OS Info
  • CPU Model
  • GPU Model
플릿 대시보드

개별 서버를 넘어
플릿 전체를 한눈에

서버 과부하와 랙별 전력 변화를 빠르게 확인

NNautiVision Fleet
RackGridTable
Live
Nodes
12
10 online · 2 offline
Avg CPU
58.3%
fleet average
GPUs
24
detected
Max GPU Temp
87C
GPU-SRV-05 #2
Current focus
GPU-SRV-03
Online
OSUbuntu 22.04 LTS
CPUIntel Xeon W-3375
Core38C / 76T
Memory256GB ECC
GPUNVIDIA RTX 4090 ×4
CUDA12.4
CPU
58%
67°C · 182W
GPU
84%
79°C · 1368W
Memory
182.4GB
of 256GB ECC
Power
1450W
CPU + GPU combined
GPU Usage
CPU Usage
Rack A
3 nodes · 12 GPUs
Peak 81°C
GPU-SRV-01online
Xeon W-33754× RTX 4090
CPU 38%GPU 74°C1180W
GPU-SRV-02online
Xeon W-33754× RTX 4090
CPU 55%GPU 78°C1340W
GPU-SRV-03warning
Xeon W-33754× RTX 4090
CPU 58%GPU 81°C1580W
Rack B
2 nodes · 8 GPUs
Peak 72°C
GPU-SRV-04online
Xeon W-33754× RTX 4090
CPU 33%GPU 65°C820W
GPU-SRV-05warning
Xeon W-33754× RTX 4090
CPU 91%GPU 87°C1520W
Rack C
3 nodes · 0 GPUs
CPU rack
INF-01online
Core i9-14900KCPU only
CPU 28%No GPU380W
INF-02online
Core i9-14900KCPU only
CPU 31%No GPU390W
INF-03offline
Core i9-14900KCPU only
CPU 0%No GPU0W
랙 비교

랙 단위로 비교하고
직관적으로 판단

랙별 운영 상태 나란히 비교
전력 합계, 온도 피크, 노드 상태 직관적 확인

Rack A
3 nodes · 12 GPUs
Peak 81°C
GPU-SRV-01online
Xeon W-33754× RTX 4090
CPU 38%GPU 74°C1180W
GPU-SRV-02online
Xeon W-33754× RTX 4090
CPU 55%GPU 78°C1340W
GPU-SRV-03warning
Xeon W-33754× RTX 4090
CPU 58%GPU 81°C1580W
Rack B
2 nodes · 8 GPUs
Peak 72°C
GPU-SRV-04online
Xeon W-33754× RTX 4090
CPU 33%GPU 65°C820W
GPU-SRV-05warning
Xeon W-33754× RTX 4090
CPU 91%GPU 87°C1520W
Rack C
3 nodes · 0 GPUs
CPU rack
INF-01online
Core i9-14900KCPU only
CPU 28%No GPU380W
INF-02online
Core i9-14900KCPU only
CPU 31%No GPU390W
INF-03offline
Core i9-14900KCPU only
CPU 0%No GPU0W
온프레미스

폐쇄망에서도 완전하게

인터넷 연결 없이, 외부 SaaS 없이, 사내망만으로 완전한 운영
보안 요건이 까다로운 환경에도 안정적 적용

폐쇄망 완전 지원

인터넷이 차단된 사내망에서도 데이터 수집, 시각화, 알림까지 안정적으로 지원

외부 의존성 zero

외부 SaaS, 클라우드 로그 적재, 외부 VPN 없이 내부 서버로 운영

경량 에이전트

경량 에이전트로 노드 자원 점유를 최소화해 GPU 서버 본연의 작업에 집중

지원 환경

익숙한 환경 그대로

별도의 OS 전환 없이, 현재 운영 중인 환경에서 바로 도입 가능

Windows
Ubuntu

지금 바로 데모를 요청하세요

랙 구성, 노드 수, 환경에 맞는 맞춤 데모를 제안해 드립니다.

데모 요청하기 →