Baidu가 차세대 멀티모달 AI 모델인 ERNIE 5.0을 공식 발표하며 글로벌 AI 경쟁 구도에 다시 불을 붙였다. 이번 모델은 2조 4천억 개 파라미터 규모로 설계된 대형 언어 모델로, 텍스트뿐 아니라 이미지 오디오 비디오까지 네 가지 영역을 모두 자연스럽게 처리하는 네이티브 옴니모달 구조를 채택한 것이 특징이다. Baidu는 이전 세대 대비 멀티모달 일관성 학습과 크로스 도메인 추론 능력을 크게 강화했다고 강조했다.

Baidu는 내부 벤치마크 결과에서 ERNIE 5.0이 GPT5.1과 Gemini 2.5 Pro를 뛰어넘는 성능을 기록했다고 밝혔다. 특히 문서 해석 차트 이해 멀티모달 조합 활용 분야에서 더 높은 점수를 보였다고 주장하며, 기업 환경에서의 실제 활용성도 대폭 확대될 것이라고 자신감을 드러냈다. 다만 벤치마크 방식과 평가 기준이 비공개라는 점에서 외부 검증이 필요하다는 지적도 나온다.
ERNIE 5.0의 등장은 중국 AI 생태계가 다시 한번 대형 기술력을 과시한 사례라 할 수 있다. 그러나 실사용 환경에서의 안정성 데이터 품질 처리 정확도는 벤치마크 수치만으로 단정 지을 수 없다. 향후 기업 고객이 이 모델을 얼마나 적극적으로 채택하고 실제 업무 환경에서 성능이 어느 정도 재현되는지에 따라 ERNIE 5.0의 시장 평가가 본격적으로 가려질 것으로 보인다.
글 / 한만수 news@cowave.kr
(c) 비교하고 잘 사는, 다나와 www.danawa.com



