출처 : 구글 딥마인드 유튜브
구글 딥마인드가 다양한 3D 가상 세계에서 상호작용하며 목표를 수행하는 차세대 AI 에이전트 ‘SIMA 2’를 발표했다. 지난해 공개된 지시 기반 멀티월드 에이전트 SIMA의 후속 모델로, 지시 수행 능력에서 한 단계 진화해 대화·추론·자기 개선(self‑improvement) 기능까지 갖춘 것이 특징이다.
SIMA 2는 구글의 대규모 모델인 Gemini의 추론 성능을 통합해 사용자의 고수준 목표를 이해하고 복잡한 reasoning 과정을 거쳐 게임 내 행동을 수행할 수 있다. 개발 과정에서는 인간 시연 영상과 언어 주석, Gemini 기반 생성 데이터가 함께 활용됐다. 이를 통해 에이전트는 수행하려는 작업을 설명하고, 목표 달성을 위한 단계까지 상세히 묘사할 수 있게 됐다.

출처 : 구글 딥마인드
테스트 결과, SIMA 2는 단순 명령 수행을 넘어 협업 파트너에 가까운 상호작용 경험을 제공하는 것으로 나타났다. 다양한 게임 스튜디오의 협업을 통해 더 많은 환경에서 학습·평가가 이뤄졌으며, 전작보다 복잡한 지시를 이해하고 훈련되지 않은 게임에서도 높은 일반화 성능을 보였다.
예컨대 ‘ASKA’나 ‘MineDojo’처럼 새로운 환경에서도 채굴·수확 등 개념을 전이해 적용하는 능력이 강화됐다.

출처 : 구글 딥마인드
SIMA 2는 자기 개선 능력도 갖췄다. 초기에는 인간 시연을 기반으로 학습하지만 이후에는 스스로 게임을 플레이하며 새로운 기술을 익히고, 자체 경험 데이터를 활용해 더 강력한 차기 모델을 학습하는 순환 구조가 가능해졌다. 이는 Genie 3이 생성한 새로운 가상 세계에서도 동일하게 작동해, 다양한 생성 환경에서 일반적 행동 능력을 키우는 기반이 됐다.
다만 긴 맥락이 필요한 과제나 복잡한 장기 목표 처리, 시각 이해 정확도, 정밀한 입력 제어 등은 여전히 해결해야 할 과제로 지적된다. 딥마인드는 SIMA 2를 연구용 한정 공개로 제공하며, 초기 파트너와 학계의 피드백을 기반으로 책임 있는 개발을 이어가겠다고 밝혔다.
글 / 김지훈 news@cowave.kr
(c) 비교하고 잘 사는, 다나와 www.danawa.com








