아마존웹서비스(AWS)가 자체 개발한 인공지능(AI) 반도체 '트레이니엄2(Trainium2)'를 탑재한 차세대 서버를 공개했다. 기존 GPU 기반 서버 대비 최대 40% 향상된 성능을 제공한다. AWS는 4일(현지시간) 미국 라스베이거스에서 열린 'AWS 리인벤트(re:Invent)' 행사에서 트레이니엄2를 탑재한 아마존 일래스틱 컴퓨트 클라우드(Amazon Elastic Compute Cloud, EC2) 인스턴스의 일반 공개를 발표했다.
트레이니엄2 기반의 Trn2 인스턴스는 현재 GPU 기반 EC2 P5e 및 P5en 인스턴스보다 30-40% 더 나은 가격 대비 성능을 제공한다. 16개의 트레이니엄2 칩을 탑재해 20.8 페타플롭스의 최대 연산 성능을 발휘할 수 있다.
AWS는 트레이니엄2 칩 64개를 상호 연결한 'EC2 Trn2 울트라서버(UltraServer)'도 함께 공개했다. 울트라서버는 뉴런링크(NeuronLink) 초고속 연결 기술을 활용해 83.2 페타플롭스의 연산 성능을 제공한다.
AWS는 AI 기업 앤트로픽(Anthropic)과 함께 '프로젝트 레이니어(Project Rainier)'를 진행 중이다. 이는 수십만 개의 트레이니엄2 칩을 활용하는 EC2 울트라클러스터를 구축하는 프로젝트다. 앤트로픽의 현재 AI 모델 학습에 사용된 엑사플롭스의 5배 이상의 성능을 제공할 예정이다. 데이비드 브라운(David Brown) AWS 컴퓨팅 및 네트워킹 부문 부사장은 "트레이니엄2는 최첨단 생성형 AI 워크로드를 지원하기 위해 특별히 설계됐으며, AWS에서 최고의 가격 대비 성능을 제공한다"고 밝혔다.
AWS는 2025년 말까지 3나노미터 공정으로 제작되는 차세대 AI 칩 '트레이니엄3(Trainium3)'도 출시할 계획이다. 트레이니엄3는 트레이니엄2 대비 4배 향상된 성능을 제공할 것으로 예상된다.
현재 트레이니엄2 기반 Trn2 인스턴스는 AWS 미국 동부(오하이오) 리전에서 사용 가능하며, 추가 리전으로 확대될 예정이다. Trn2 울트라서버는 현재 프리뷰 버전으로 제공되고 있다.
트리이니엄2에 대한 자세한 사항은 AWS에서 확인할 수 있다.
기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.
AI Matters 뉴스레터 구독하기