
🔎 핵심만 콕콕
- 아마존웹서비스가 최신 AI 칩 트레이니엄3를 공개했습니다.
- 기업이 대규모 AI 모델을 더 빠르고 저렴하게 운영할 수 있게 될 전망인데요.
- 빅테크 기업이 자체 AI 칩 개발에 나서면서 반도체 시장이 바뀔 것이라는 관측도 나옵니다.
아마존, 차세대 AI 칩 발표
🎉 트레이니엄3 출시: 아마존웹서비스(AWS)가 차세대 AI 칩 '트레이니엄3'를 공개했습니다. 트레이니엄은 AWS가 설계한 주문형 반도체(ASIC)인데요. 지난 2일(이하 현지 시각), AWS는 미국 라스베이거스에서 개최한 연례 클라우드컴퓨팅 콘퍼런스 '리인벤트(re:Invent) 2025'에서 트레이니엄3를 탑재한 '아마존 트레이니엄3 울트라서버'를 정식 출시했습니다.
주문형 반도체(ASIC): 특정 용도를 목적으로 제작된 맞춤형 집적 회로입니다. 범용으로 쓰이는 그래픽 처리 장치(GPU)와 달리 특정 기능이나 특정 애플리케이션에 최적화해 설계·제작되죠. 따라서 불필요한 기능이 제거돼 성능이 높고, 전력은 적게 듭니다.
🖥 성능 어느 정도냐면: 트레이니엄3는 기업이 대규모 AI 모델을 더 빠르고 저렴하게 운영할 수 있는 환경을 마련할 전망입니다. 트레이니엄2보다 최대 4.4배 높은 컴퓨팅 연산 성능을 보여주는데요. 여기에 전력 효율도 4배 높아졌으며, 메모리 대역폭도 4배가량 더 커졌죠. 이로 인해 모델 훈련 시간이 수개월에서 수주로 단축되며, 더 많은 사용자의 추론 요청을 동시에 처리할 수 있게 됐습니다. 여기에 운영 비용이 기존 대비 최대 50%까지 줄어든 결과도 보였죠.
🔬 후속작도 개발 중이야: AWS는 후속 제품인 '트레이니엄4' 개발에도 돌입했다고 밝혔습니다. 트레이니엄3 대비 성능을 3배 이상 높일 전망인데요. 여기에 엔비디아 칩 간 고속 연결 기술인 'NV링크'를 지원할 것이라고 언급했죠. 엔비디아 칩을 쓰던 기업이 AWS 칩으로 교체하기 쉽게 호환성 장치를 마련한 것입니다. 향후 엔비디아의 독점을 깨고 시장 판도를 바꾸려는 전략으로 해석됩니다.
📜 수치는 어디에?: 하지만 업계 반응은 차갑습니다. AWS가 트레이니엄3의 구체적 플롭스 수치, 대규모언어모델 벤치마크, 엔비디아의 주력 그래픽처리장치(GPU) 제품군과의 비교 수치 등 칩 절대적인 성능 지표를 공개하지 않았기 때문인데요. 구글이 자체 개발한 텐서처리장치(TPU)의 성능을 구체적으로 밝힌 것과는 대비되죠. 업계에선 비용은 줄일 순 있으나 여전히 고성능이 필요한 영역에선 GPU를 대체하긴 힘들 것이라는 목소리가 나옵니다.
그래픽처리장치(GPU): 컴퓨터에서 그래픽 연산을 처리해 결괏값을 모니터에 출력하는 연산 장치입니다. 수많은 단순 계산을 빠르게 처리할 수 있어 많은 연산이 필요한 AI 학습에 널리 활용됩니다.
텐서처리장치(Tensor Processing Unit, TPU): 구글이 머신러닝을 위해 직접 설계한 인공지능 전용 반도체입니다. 원래 그래픽 처리용으로 개발됐다가 AI 학습에 활용된 GPU와 달리, TPU는 처음부터 AI 연산만을 위해 만들어진 맞춤형 칩이죠. 복잡한 행렬 계산을 빠르게 처리해 속도가 더 빠르고 전력 소모도 적다는 장점이 있습니다.
쏟아져 나온 AWS 신제품
🤖 AI 인프라 강화에 나서: 한편, 이날 AWS는 신제품과 신규 서비스도 대거 발표했습니다. 특히 AI 에이전트 서비스를 전면에 내세우며 AI 인프라 강화를 천명했는데요. 고객의 기존 데이터센터 안에 전용 AI 인프라를 구축해 주는 'AI 팩토리즈' 서비스를 발표하며 이목을 끌었죠. 이밖에 AI 플랫폼 '아마존 베드록'의 신규 모델을 최초 공개했으며, 기업이 AI 에이전트를 만들 때 필요한 과정을 지원하는 플랫폼 '아마존 베드록 에이전트코어'의 새 기능도 소개했습니다.
AI 에이전트: 사용자의 명령이나 목적에 따라 스스로 판단하고 실행하는 인공지능 기반 소프트웨어 시스템입니다. 자연어 명령을 코드로 바꾸는 코딩 에이전트, 일상 언어로 대화하며 작업을 처리하는 챗봇형 에이전트, 반복 업무를 자동으로 수행하는 작업 자동화형 에이전트, 텍스트·이미지·음성 등의 입력을 처리하는 멀티모달 에이전트 등이 있습니다.
📢 아마존 노바도 업그레이드: AWS의 자체 AI 모델인 '아마존 노바'도 성능이 향상됐습니다. AWS는 노바의 후속 버전인 '노바2'를 선보였는데요. 노바2는 추론, 멀티모달 처리, 대화형 AI 전반에서 가격 대비 높은 성능을 제공하는 모델로 알려졌죠. 이와 함께 모델의 트레이닝 과정을 각 기업에 맞춰 개발할 수 있도록 지원하는 '노바 포지'(Nova Forge) 서비스도 공개됐습니다.
👀 시장 반응은?: 지난 2일, 뉴욕증시에선 AI·반도체 종목의 움직임이 두드러졌습니다. AWS의 트레이니엄3 공개가 투자심리를 자극했는데요. 반도체 관련 주요 30개 기업으로 구성된 필라델피아 반도체 지수는 전장 대비 1.84% 상승했죠. 다만, 트레이니엄3가 공개된 뒤 AI 칩 경쟁이 심화할 것이라는 우려에 주요 AI 관련 기업이 장중 상승분을 대부분 반납하기도 했습니다.
엔비디아 위협 나선 빅테크
⚙ 구글 TPU에 엔비디아 휘청?: AWS뿐 아니라 최근 빅테크 기업이 AI 칩 자립에 나서면서 본격적인 AI 칩 경쟁이 시작됐습니다. 특히, 엔비디아의 독주를 위협하는 것은 구글의 TPU인데요. 엔비디아 GPU 대비 35%에서 많게는 80%까지 줄어든 비용이 강점입니다. 덕분에 엔비디아의 핵심 고객인 메타까지 구글 TPU 사용을 고려 중인 것으로 알려졌죠.
💨 자체 AI 칩 개발에 뛰어들어: 마이크로소프트도 자체 AI 서버칩인 '마이아'(Maia)를 공개했습니다. 마이크로소프트는 마이아가 엔비디아 GPU 대비 총소유비용을 절감할 수 있다고 강조했는데요. 메타는 'MTIA'를 직접 개발해 활용 중이며, 올해 말까지 새 버전을 출시할 예정입니다. 오픈AI 역시 브로드컴과 함께 'ChatGPT 전용 칩' 개발을 추진 중입니다.
🤔 반도체 시장 재편될까: 이처럼 그간 GPU 중심으로 굳어져 있던 AI 반도체 시장도 변화할 조짐을 보입니다. GPU 수급이 원활하지 않고, 높은 비용도 문제가 되면서 TPU가 대체 인프라로 떠올랐는데요. 반도체 성능을 높이는 것이 기술적으로 어렵다 보니 맞춤형 반도체를 개발하는 것도 성능을 더 높일 방법으로 거론되죠. 다만, 단기간에 완전한 구조 재편은 어려울 전망입니다. 업계에서는 빅테크 기업의 자체 칩 개발이 엔비디아 의존도를 낮추는 선에 머무르리라 내다보죠.