[출처 : 챗GPT 생성 이미지]
구글의 인공지능 연구 조직 딥마인드(DeepMind)의 CEO 데미스 하사비스(Demis Hassabis)가 최근 구글의 최신 비디오 생성 AI 모델 Veo 3를 활용한 게임 개발 가능성을 시사했다.
8일 밤(현지 시간) 한 사용자가 X(구 트위터)에 “Veo 3로 만든 영상을 게임으로 플레이하게 해달라”며 “플레이 가능한 월드 모델은 언제쯤 나오나?”라는 글을 올리자, 하사비스는 “그거 정말 멋질 것 같은데”라는 답글을 남겼다.
수요일 아침에는 구글 AI 스튜디오와 제미나이 API 제품 총괄인 로건 킬패트릭(Logan Kilpatrick)도 '입에 달린 지퍼를 닫은' 이모지로 의미심장한 반응을 보였다.
[출처 : 데미스하사비스 X계정]
두 임원의 반응은 다소 장난기 섞인 뉘앙스지만, TechCrunch에 따르면 구글 대변인은 “현재로서는 발표할 내용이 없다”고 밝혔다. 그럼에도 불구하고, 구글이 ‘플레이 가능한 월드 모델’ 개발에 나서는 것은 충분히 가능한 시나리오다.
월드 모델과 기존의 비디오 생성 모델은 개념이 다르다. 월드모델(LWM)은 물리적 세계의 구조, 동작, 규칙을 학습하고 이를 바탕으로 상황을 예측하거나 새로운 환경을 생성하는 AI 시스템으로 인간이 세상에 대한 경험을 통해 머릿속에서 세상을 이해하고 미래를 예측하는 방식과 유사한 원리로 작동한다. 반면, 비디오 생성 모델은 실제 같은 영상 시퀀스를 합성하는 데 초점을 맞춘다.
구글은 현재 멀티모달 기반 모델인 Gemini 2.5 Pro를 인간 두뇌의 다양한 측면을 시뮬레이션하는 월드 모델로 발전시키는 계획을 갖고 있다. 지난해 12월, 딥마인드는 ‘무한한’ 플레이 가능한 세계를 생성할 수 있는 모델 ‘Genie 2’를 공개했다. 이어 올해 1월에는 현실 세계를 시뮬레이션하는 AI 모델 개발을 위한 신규 팀을 구성한 사실이 알려졌다.
[출처 : 구글 딥마인드 홈페이지]
이 분야에는 구글 외에도 다양한 주체가 뛰어들고 있다. 대표적으로 AI 선구자 페이페이 리(Fei-Fei Li)는 작년에 ‘World Labs’라는 스타트업을 설립하고, 단 한 장의 이미지만으로 게임 같은 3D 장면을 생성하는 AI 시스템을 개발했다.
[출처 : 월드랩스 홈페이지]
Veo 3는 현재 공개 프리뷰 단계로 현실 세계의 물리법칙을 기반으로 사실적인 움직임을 구현할 수 있지만, 아직은 본격적인 월드 모델은 아니다. 아직은 게임 내 시네마틱 스토리텔링—예컨대 컷신, 트레일러, 내러티브 프로토타이핑 등—에 제한적으로 활용될 수 있다.
현재 Veo 3는 ‘수동 출력’ 방식의 생성 모델이기 때문에, 진정한 플레이 가능한 환경을 구현하려면 향후 버전에서 보다 ‘능동적이고, 상호작용 가능하며, 예측 가능한’ 시뮬레이터로의 전환이 필요하다.
하지만 게임 개발에서 핵심은 단순히 사실적인 비주얼이 아니다. 핵심은 실시간성, 일관성, 그리고 제어 가능한 시뮬레이션이다. 때문에 구글이 향후 Veo와 Genie를 결합한 하이브리드 접근 방식을 취할 가능성도 있다.
만약 구글이 플레이 가능한 월드 모델 개발에 본격적으로 나선다면, 마이크로소프트, 시나리오(Scenario), 런웨이(Runway), 피카(Pika), 그리고 오픈AI의 비디오 생성 모델인 Sora 등과 경쟁하게 될 것이다.
글 / 홍정민 news@cowave.kr
(c) 비교하고 잘 사는, 다나와 www.danawa.com