앤트로픽(Anthropic)의 AI 챗봇 클로드(Claude)가 또다시 멈췄다. 테크타임스(TechTimes)에 따르면 클로드는 6월 16일 대규모 서비스 장애를 겪었다. 이는 6월 5일 이후 12일 사이에 발생한 열 번째 중단 사태로, 앤트로픽의 인프라가 한계에 다다랐다는 지적이 커지고 있다.
이날 장애는 미국 동부시간 오전 6시 5분께부터 접속 오류가 늘기 시작했고, 오후 1시 35분 무렵에는 미국 내 수천 명의 이용자가 영향을 받았다. 오퍼스 4.8(Opus 4.8)과 하이쿠 4.5(Haiku 4.5) 모델에서 오류가 이어졌으며, 오후 2시께 복구를 시도한 뒤에도 문제가 완전히 가시지 않았다.
앤트로픽은 전례 없는 수요로 인프라가 받는 부담이 커졌다고 인정했다. 클로드 코드(Claude Code)를 앞세운 코딩 수요가 폭증하면서 트래픽이 빠르게 늘었고, 이를 감당할 서버 처리 능력이 따라가지 못하는 상황이 반복되고 있다는 것이다.
잦은 중단은 기업 고객의 신뢰에 직접적인 영향을 미친다. 클로드를 업무 워크플로나 제품에 통합한 조직일수록 서비스 중단은 곧 자사 서비스의 차질로 번진다. 특히 코딩과 자동화처럼 실시간성이 중요한 작업에서는 짧은 중단도 큰 차질로 이어진다. 개발 파이프라인이 멈추거나 고객 응대가 지연되면 그 피해는 곧바로 매출과 신뢰로 직결된다. 안정적인 가동 시간(업타임)을 보장하지 못하면, 성능이 뛰어나더라도 도입을 망설이게 만드는 요인이 된다.
이번 사태는 AI 수요의 급성장이 공급 인프라의 확충 속도를 앞지르고 있음을 드러낸다. 모델 성능 경쟁에 가려져 있던 안정성과 확장성 문제가 전면에 떠오른 것이다. 앤트로픽은 클로드 코드와 에이전트 수요가 폭발적으로 늘면서 단기간에 트래픽이 급증했고, 데이터센터와 연산 자원 확보가 이를 뒤따르는 구조다. 경쟁사 역시 비슷한 압박을 받고 있어, 향후 AI 기업의 경쟁력은 모델의 품질뿐 아니라 대규모 트래픽을 끊김 없이 처리하는 운영 역량에서도 갈릴 전망이다.
앤트로픽은 인프라 증설과 부하 분산에 속도를 내야 하는 상황에 놓였다. 단기간에 열 번이나 멈춘 사실은 폭증하는 수요를 안정적으로 받아낼 설비 투자가 모델 개발만큼이나 시급한 과제가 됐음을 말해 준다. 반복되는 장애가 길어질 경우 일부 고객이 대체 모델로 옮겨갈 가능성도 배제하기 어렵다. 클로드의 성능을 높게 평가하는 기업조차 안정성 문제 앞에서는 도입 결정을 미루게 된다. 안정성 확보가 성장세를 떠받치는 전제 조건으로 떠올랐다.
자세한 내용은 테크타임스(TechTimes)에서 확인할 수 있다.
이미지 출처: 이디오그램 생성
AI Matters 뉴스레터 구독하기








