본문 바로가기
기술

아마존(AMZN): "클라우드 제왕의 칩 독립 선언" AWS 그라비톤(Graviton)과 트레이니움의 기술적 해자

by 아이럽스토리지 2025. 12. 9.
반응형

1. 임대업자에서 제조업자로의 진화

세계 1위 클라우드 서비스인 아마존 웹 서비스(AWS)는 오랫동안 인텔과 엔비디아의 최대 고객이었습니다.

서버를 돌리려면 인텔의 제온(Xeon) CPU와 엔비디아의 GPU가 필수였기 때문입니다.

이는 아마존 매출의 상당 부분이 부품 구매 비용으로 나간다는 것을 의미합니다.

하지만 최근 AWS 데이터센터의 풍경이 바뀌고 있습니다.

인텔 로고가 박힌 서버 대신, 아마존이 직접 설계한 로고가 박힌 칩들이 랙(Rack)을 채우고 있습니다.

엔지니어 관점에서 볼 때, 아마존의 자체 칩 전략은 단순한 원가 절감을 넘어섰습니다.

x86 아키텍처가 지배하던 서버 시장을 효율성의 ARM 아키텍처로 강제 전환시키며, 경쟁사들이 따라올 수 없는 압도적인 가성비를 무기로 시장을 잠식하고 있기 때문입니다.

 


2. CPU의 혁명: 그라비톤(Graviton)과 ARM 생태계

아마존 칩 전략의 핵심은 그라비톤(Graviton) 프로세서입니다.

인텔이나 AMD가 사용하는 복잡한 x86 방식이 아닌, 스마트폰에 주로 쓰이는 ARM 아키텍처를 기반으로 만든 서버용 CPU입니다.

  1. 압도적인 전성비 (Performance per Watt)
    엔지니어들이 서버를 선택할 때 가장 중요하게 보는 것은 '같은 돈으로 얼마나 많은 트래픽을 처리할 수 있는가'입니다.
    그라비톤 4는 기존 인텔 칩 기반의 인스턴스(서버) 대비 최대 40% 더 나은 가격 대비 성능을 제공합니다.
    전기를 덜 먹고 열을 덜 내기 때문에 데이터센터 운영 비용이 획기적으로 줄어듭니다.

  2. 시장의 표준을 바꾸다
    과거에는 "서버는 무조건 인텔"이라는 공식이 있었습니다. 소프트웨어 호환성 때문입니다.
    하지만 AWS가 그라비톤을 밀어붙이면서 전 세계 개발자들이 자사의 서비스를 ARM 기반으로 수정하기 시작했습니다.
    넷플릭스, 에어비앤비 같은 거대 기업들이 비용을 아끼기 위해 인텔 서버를 버리고 그라비톤 서버로 갈아타고 있습니다.

3. AI 반도체의 독립: 트레이니움(Trainium)과 인퍼런시아(Inferentia)

아마존은 CPU뿐만 아니라, 엔비디아가 독점하고 있는 AI 가속기 시장에도 도전장을 내밀었습니다.

  1. 인퍼런시아 (Inferentia)
    AI 모델을 만드는 것(학습)보다, 만들어진 모델을 서비스하는 것(추론)에 더 많은 비용이 듭니다.
    알렉사(Alexa)나 추천 알고리즘을 돌릴 때마다 엔비디아 GPU를 쓰면 비용이 감당이 안 됩니다.
    아마존은 이 '추론' 작업에 특화된 인퍼런시아 칩을 만들어 비용을 최대 70%까지 낮췄습니다.

  2. 트레이니움 (Trainium)
    엔비디아 H100의 직접적인 경쟁자입니다. 거대언어모델(LLM) 학습을 위해 설계되었습니다.
    엔비디아 칩 품귀 현상으로 GPU를 구하지 못한 기업들에게 AWS는 "기다리지 말고 우리 트레이니움을 써라, 성능은 비슷하고 가격은 반값이다"라고 제안하며 점유율을 높이고 있습니다.

 


4. 숨겨진 무기: 나이트로(Nitro) 시스템

아마존의 자체 칩 전략을 완성하는 마지막 퍼즐은 AWS 나이트로(Nitro) 시스템입니다.

일반적인 클라우드 서버는 CPU 성능의 약 30%를 가상화(Virtualization), 보안, 네트워크 관리 등 '관리 업무'에 씁니다.
내가 돈 내고 빌린 서버 성능의 30%는 아마존이 관리용으로 떼어가는 셈입니다.

하지만 아마존은 이 관리 업무만 전담하는 별도의 하드웨어 카드(Nitro Card)를 만들었습니다.
덕분에 메인 CPU(그라비톤 등)는 100% 고객의 작업을 처리하는 데만 집중할 수 있습니다.
이는 마이크로소프트나 구글도 쉽게 흉내 내지 못하는 AWS만의 하드웨어 아키텍처 기술입니다.

 


5. 하드웨어를 통제하는 자가 마진을 남긴다

애플이 아이폰의 칩을 직접 만들면서 경쟁사들을 압도했듯, 아마존은 클라우드 서버의 칩을 직접 만들면서 이익률을 극대화하고 있습니다.

고객 입장에서는 AWS의 자체 칩을 쓰면 클라우드 요금이 싸지니까 좋습니다.
아마존 입장에서는 비싼 인텔/엔비디아 칩을 덜 사도 되고, 전기세도 아끼니 이익이 남습니다.

더 무서운 것은 '락인(Lock-in)' 효과입니다.
아마존의 그라비톤과 트레이니움 환경에 최적화된 서비스를 구축한 기업은, 다른 클라우드(Azure, GCP)로 이사 가기가 기술적으로 매우 어려워집니다.
아마존은 자체 칩을 통해 클라우드 제왕의 자리를 영구적으로 굳히고 있습니다.


📌 함께 읽어보면 좋은 글

아마존이 그라비톤과 트레이니움으로 칩 독립을 선언했다면, 구글은 TPU라는 강력한 무기로 이미 AI 인프라 효율을 극한으로 끌어올렸습니다. 두 클라우드 거인의 칩 전략이 어떻게 다른지 비교해 보세요.

🔗 구글이 엔비디아를 덜 사도 되는 이유 (TPU 분석) 글 보러가기

반응형