AWS, 자체칩 ‘트레이니엄3’ 출시 전력소모 40% 줄이고 성능 4배↑ “엔비디아 GPU대비 운영비 절반” 가성비 무장, 엔비디아와 가격경쟁 차세대 ‘트레이니엄4’도 개발 착수

아마존웹서비스(AWS)가 전력 효율성을 크게 끌어올린 차세대 인공지능(AI) 칩 ‘트레이니엄3’(작은 사진)를 공개하며 엔비디아의 지배력이 절대적인 AI 반도체 시장에 정면 도전장을 냈다. AI 인프라의 가장 큰 병목으로 꼽히는 전력 소모를 40% 줄이면서 운영비를 최대 절반까지 낮출 수 있다는 점을 내세웠다. 그간 그래픽처리장치(GPU)로 독보적 우위를 점했던 엔비디아의 독주체제에 ‘가성비’로 무장한 아마존과 구글의 자체칩(주문형반도체·ASIC)이 가세하며 글로벌 AI판도에 지각변동이 일고 있다.

▶아마존 AI칩 전력효율 40% 개선…‘전성비’ 무장 엔비디아와 가격경쟁 예고=AWS는 2일(현지시간) 미국 라스베이거스에서 열린 연례 행사 ‘리인벤트 2025(Re:Invent)’에서 트레이니엄3를 출시했다고 밝혔다.

이번 신형 칩은 전작 트레이니엄2 대비 컴퓨팅 성능을 4배 이상 높이고, 에너지 소비량은 약 40% 줄인 것이 특징이다. 이른바 전성비(전력 대비 성능 비율)를 크게 개선해 대규모 AI 훈련·추론 환경에서 비용 절감 효과가 크다는 게 회사 설명이다.

AWS는 트레이니엄3를 활용하면 엔비디아 GPU 기반 대비 AI 모델 훈련·운영 비용을 최대 50 줄일 수 있다고 강조했다. 맷 가먼 AWS 최고경영자(CEO)는 “트레이니엄3는 업계 최고 수준의 비용 효율성을 보여준다”고 말했다.

AWS는 이미 다음 세대 제품인 ‘트레이니엄4’ 개발에도 착수했다. 트레이니엄3 대비 3배 이상 성능을 목표로 하되, 엔비디아의 칩 간 고속 연결 기술 ‘NV링크’를 지원할 것이라고 예고했다. 엔비디아 기반 인프라를 쓰던 기업이 AWS 칩으로 자연스럽게 넘어오도록 ‘호환성’ 장치를 마련해 향후 시장 판도 변화를 노린 전략으로 풀이된다.

AWS는 이와 함께 자체 AI 모델 ‘노바’의 후속 버전 ‘노바2’와, 기업별 맞춤형 AI 모델 개발을 지원하는 ‘노바 포지(Nova Forge)’ 서비스도 공개하며 AI 플랫폼 생태계 확장에도 속도를 높이고 있다.

▶구글·아마존 등 자체칩 속속 출시…엔비디아 독주체제 ‘흔들’=AI칩 시장에서 엔비디아는 80~90% 점유율로 독주하고 있지만, 최근 빅테크들이 전력 효율성을 앞세운 자체 칩으로 잇따라 견제에 나서며 지형이 흔들리고 있다.

구글은 최근 TPU 차세대 칩 ‘아이언우드’를 공개하며 메타 등 외부 고객 대상 대량 공급을 추진해 엔비디아와 정면 승부를 예고했다.

TPU는 처음부터 딥러닝 수학 계산(행렬 연산)에 최적화된 맞춤형 칩으로 설계됐다. 한 번 입력된 데이터를 다수 연산에 반복 활용하고 중간 연산 결과를 외부 메모리에 저장하지 않은 채 인접 연산 유닛으로 즉시 전달한다. AI 모델에 최적화된 제품인 셈이다. TPU는 메모리 접근에 따른 병목이 줄면서 전력 효율도 높다. TPU는 GPU 대비 35%에서 최대 80% 비용을 절감할 수 있는 것으로 알려졌다.

반면 GPU는 게임 그래픽 처리를 위해 개발된 뒤 AI 연산에 활용됐다는 점에서 TPU보다는 활용범위가 넓다. 범용 병렬 연산을 전제로 해 외부 메모리와의 데이터 입출력이 잦은 구조다. 이 때문에 GPU는 많은 전력이 필요하다.

이미 시장에선 구글의 TPU가 AI칩 공급망을 다변화시킬 것으로 전망하고 있다. 모건스탠리는 최근 보고서에서 “알파벳(구글 모회사)의 AI칩 사업이 2027년 최대 100만개 출하까지 확대될 수 있다”며 “시총 4조달러 돌파가 가시권에 들어왔다”고 평가했다.

구글의 추격을 의식한 듯 엔비디아는 지난달 말 자사 엑스(X·옛 트위터)를 통해 “모든 AI 모델을 구동하고 컴퓨팅이 이뤄지는 모든 곳에서 이를 수행하는 것은 우리 플랫폼뿐”이라며 “엔비디아 제품은 특정한 AI 구조나 기능을 위해 설계된 주ASIC보다 뛰어난 성능과 다용성과 호환성을 제공한다”고 견제구를 날린 바 있다.

서지연 기자