구글의 제미나이(Gemini)가 3번째 버전 출시로 챗GPT와 다른 경쟁사들을 제치고 업계 벤치마크 테스트에서 가장 우수한 AI 챗봇으로 평가받았다. 월스트리트저널(WSJ)이 22일(현지 시각) 보도한 내용에 따르면, 이번 주 공개된 제미나이 3는 업계 합의 기준 벤치마크 테스트에서 최고 점수를 기록하며 AI 챗봇 경쟁 구도를 뒤흔들었다.
이번 성과는 수개월간 자체적으로 모델을 테스트해 온 구글 직원들에게 공개적인 검증이 됐다. 직원들은 농담을 요청하거나 수학 문제로 난제를 내며 테스트를 진행했고, 마침내 LLM 분야에서 구글에 유리한 결과를 가져올 무언가를 찾았다는 확신을 갖게 됐다.
제미나이 제품 관리 수석 이사인 툴시 도시(Tulsee Doshi)는 '바이브 체크(vibe checks)'의 일환으로 인도에서 널리 사용되지만 인터넷상에서는 그다지 많지 않은 언어인 구자라트어로 글을 쓰도록 모델에 요청했다. 결과는 이전 모델들보다 훨씬 뛰어났다. 도시는 "나는 이것을 생명의 징후라고 부른다"며 "사람들이 돌아와서 '느낌이 온다, 뭔가 찾은 것 같다'고 말했다"고 전했다.
클라우드 콘텐츠 관리 회사 박스(Box)의 최고경영자(CEO)인 애런 레비(Aaron Levie)는 지난주 말 출시 며칠 전에 제미나이 3에 대한 조기 접근 권한을 받았다. 박스는 주말 동안 자체 평가를 진행하며 모델이 복잡한 대량 문서 세트를 얼마나 잘 분석하는지 확인했다.
이번 제미나이 3의 성공은 구글 CEO 순다르 피차이(Sundar Pichai)가 회사의 AI 개발 전략을 전면 개편하기 위해 노력해 온 결과다. 구글은 그동안 AI 분야에서 경쟁사들에 뒤처진다는 평가를 받아왔지만, 이번 신규 모델 출시로 업계 선두 자리를 되찾을 발판을 마련했다.
업계 관계자들은 제미나이 3가 복잡한 언어 처리와 문서 분석 능력에서 기존 모델들을 크게 앞섰다고 평가했다. 특히 비주류 언어에서의 성능 향상은 구글의 기술력이 한 단계 도약했음을 보여주는 사례로 받아들여지고 있다.
해당 기사의 원문은 월스트리트저널에서 확인 가능하다.
이미지 출처: 구글
AI Matters 뉴스레터 구독하기



