1. 엔비디아의 가장 뜨거운 파트너
AI 붐이 일면서 엔비디아 주가가 폭등할 때, 조용히 뒤따라 5배 이상 오른 기업이 있습니다.
바로 데이터센터의 전력과 냉각 솔루션을 공급하는 버티브 홀딩스(Vertiv Holdings)입니다.
최신 AI 반도체가 뿜어내는 엄청난 열기를 잡지 못하면, 수천억 원짜리 장비가 멈추거나 심지어 화재로 이어질 수 있기 때문입니다.
오늘은 AI 반도체가 고성능화될수록 왜 버티브의 열 관리(Thermal Management) 기술이 필수불가결한지, 그리고 공랭식을 넘어 액체 냉각으로 가는 기술적 흐름을 분석해 봅니다.

2. AI 서버의 딜레마: 성능이 높으면 불타오른다
반도체의 성능이 좋아진다는 것은, 좁은 면적에 더 많은 트랜지스터를 집어넣는다는 뜻입니다.
그리고 전기가 흐르는 길이 좁아질수록 저항이 커져 엄청난 열이 발생합니다.
엔비디아의 최신 GPU인 H100 하나가 소모하는 전력(TDP)은 최대 700W에 달합니다.
서버 랙 하나에 이런 GPU가 수십 개 꽂히면, 랙 하나당 발생하는 열은 과거 데이터센터 전체가 내뿜던 열과 맞먹습니다.
만약 냉각 시스템이 멈춰서 서버실 온도가 올라가면 어떻게 될까요?
첫째, 쓰로틀링(Throttling)이 걸립니다.
칩이 타는 것을 막기 위해 스스로 성능을 강제로 낮춥니다.
비싼 AI 칩이 제 성능을 못 내는 것입니다.
둘째, 셧다운(Shutdown)됩니다.
한계 온도를 넘으면 서버가 꺼져버립니다.
서비스 중단을 의미합니다.
셋째, 화재 위험입니다.
실제로 리튬이온 배터리(UPS)나 과열된 서버에서 화재가 발생해 데이터센터가 전소되는 사고가 종종 발생합니다.

3. 공랭식의 한계와 버티브의 솔루션
과거에는 서버실 전체에 강력한 에어컨 바람을 불어넣는 공랭식(Air Cooling)만으로 충분했습니다.
차가운 공기가 나오는 복도와 뜨거운 공기가 나가는 복도를 구분하는 것만으로도 관리가 되었습니다.
하지만 생성형 AI 시대에는 공랭식만으로는 한계가 왔습니다.
공기는 열을 전달하는 효율이 낮기 때문입니다.
아무리 센 바람을 불어도 랙당 100kW가 넘는 고밀도 AI 서버의 열을 식히기엔 역부족입니다.
버티브는 여기서 두 가지 솔루션을 제시합니다.
- 고효율 항온항습기
일반 에어컨과 달리 온도와 습도를 오차 범위 1도 이내로 제어하는 정밀 냉각 장비입니다.
서버 바로 옆이나 뒤에 붙여서 열원을 즉각적으로 식혀줍니다. - 액체 냉
핵심입니다. 물은 공기보다 열전도율이 약 3,000배 높습니다.
버티브는 서버 칩 위에 바로 냉각판을 붙여 물을 순환시키는 다이렉트 투 칩(Direct-to-Chip) 방식과, 아예 랙 전체를 특수 용액에 담그는 기술을 보유하고 있습니다.
엔비디아와 협력하여 차세대 냉각 시스템을 개발하는 이유도 바로 이 액체 냉각 기술 때문입니다.
4. 전력 관리: 깨끗한 전기 공급의 중요성
열 관리만큼 중요한 것이 전력 관리입니다.
버티브의 또 다른 주력 제품은 UPS(무정전 전원장치)와 PDU(전원 분배 장치)입니다.
AI 학습은 며칠, 몇 달 동안 멈추지 않고 계속되어야 합니다.
순간적으로 전압이 튀거나 0.1초라도 정전이 되면 학습하던 데이터를 모두 날릴 수 있습니다.
버티브의 UPS는 전기가 끊겨도 배터리로 즉시 전환해 서버를 살리고, PDU는 고전력을 안정적으로 각 서버에 분배합니다.
AI 데이터센터가 전기를 많이 먹을수록, 이 전기를 안전하게 배달하고 관리하는 장비의 수요는 늘어날 수밖에 없습니다.

5. 결론: 칩보다 오래가는 인프라의 가치
반도체 칩은 2~3년이면 구형이 되어 교체해야 합니다.
하지만 냉각 시스템과 전력 인프라는 한번 구축하면 10년 이상 사용됩니다.
AI 칩 경쟁이 엔비디아, AMD, 구글, 메타의 춘추전국시대라면, 이 뜨거운 칩들을 식혀주는 냉각 시장은 버티브가 아주 강력한 해자를 구축하고 있습니다.
"곡괭이와 청바지를 파는 기업"이라는 비유가 가장 잘 어울리는 곳이 바로 버티브입니다.
AI가 발전할수록 더 뜨거워질 것이고, 더 뜨거워질수록 버티브의 가치는 올라갈 것입니다.
📌 함께 읽어보면 좋은 글
버티브가 데이터센터의 열을 식히는 역할을 한다면, 칩 자체의 설계를 통해 발열과 전력 소모를 줄이려는 노력도 계속되고 있습니다. 구글이 자체 칩 TPU를 통해 어떻게 인프라 비용을 아끼고 있는지 확인해 보세요.
'기술' 카테고리의 다른 글
| 브로드컴(AVGO) & VM웨어: 가상화 독점의 폐해와 기술적 락인 (2) | 2025.12.08 |
|---|---|
| 아리스타(ANET) vs 시스코(CSCO): 데이터센터의 왕좌가 바뀐 기술적 이유 (소프트웨어와 실리콘의 차이) (1) | 2025.12.08 |
| 팔란티어(PLTR): 도대체 뭐 하는 회사일까? 단순한 AI가 아니라 '기업용 데이터 OS'인 기술적 이유 (0) | 2025.12.06 |
| 테슬라 FSD '규칙'이 아닌 '신경망'으로 복잡한 도심을 뚫는 법 (1) | 2025.12.05 |
| 아이온큐(IONQ): 양자컴퓨터, 꿈인가 사기인가? 엔비디아 GPU 수만 대를 이기는 '큐비트'의 원리 (1) | 2025.12.05 |