[출처 : 구글 딥마인드 홈페이지]
구글이 자사의 AI 플랫폼 '제미나이(Gemini)'에 영상 생성 AI 모델 '비오 2(Veo 2)'를 탑재하고 정식 서비스를 시작했다. 이번 출시는 AI 기반 제품의 상용화에 힘을 쏟고 있는 구글의 전략을 반영한 조치로, 향후 오픈AI, 메타 등과의 치열한 영상 생성 AI 경쟁이 예고된다.
[출처 : 구글 딥마인드 유튜브]
비오 2는 지난해 12월 구글의 클라우드 플랫폼 '버텍스 AI(Vertex AI)'를 통해 얼리 액세스 형태로 일부 공개됐으며, 당시에는 초당 50센트의 요금으로 사용이 가능했다. 이후 실험적 기능인 유튜브 ‘드림 스크린(Dream Screen)’에 적용되어 쇼츠(Shorts) 영상 생성 기능으로 활용되기도 했다.
이번 정식 출시에 따라, 구글은 4월 15일(현지시간)부터 프리미엄 요금제인 ‘제미나이 어드밴스드(Gemini Advanced)’ 구독자를 대상으로 비오 2 서비스를 제공한다고 밝혔다. 사용자는 제미나이 웹 및 모바일 앱 내 모델 선택 메뉴에서 ‘비오 2’를 선택한 후, 텍스트 프롬프트를 입력해 16:9 비율, 720p 해상도의 8초 길이 동영상을 생성할 수 있다.
생성된 영상은 구글의 ‘신스ID(SynthID)’ 기술을 적용해 제작된 콘텐츠임을 나타내는 워터마크가 자동 삽입되며, MP4 파일 형태로 다운로드할 수 있다. 아울러 ‘공유’ 버튼을 통해 생성된 영상을 틱톡이나 유튜브 등 소셜 플랫폼에 직접 업로드하는 것도 가능하다.
다만, 비오 2는 일반적인 텍스트 기반 AI 기능보다 높은 연산 자원을 필요로 하기 때문에 구글은 월별 사용량에 제한을 둘 방침이다. 구체적인 한도는 아직 공개되지 않았으며, 사용량이 한도에 근접할 경우 이용자에게 알림이 제공될 예정이다. 비오 2는 또한 구글 랩스의 실험적 기능인 ‘위스크(Whisk)’에도 도입됐다.
[출처 : 구글 유튜브]
위스크는 텍스트 프롬프트와 참조 이미지를 바탕으로 이미지를 생성하는 도구로, 이번에 ‘위스크 애니메이트(Whisk Animate)’ 기능이 새롭게 추가돼 정적 이미지를 8초 길이의 동영상으로 변환할 수 있게 됐다. 이 기능은 '구글 원 AI 프리미엄(Google One AI Premium)' 구독자를 대상으로 제공된다. 구글 딥마인드 CEO 데미스 허사비스는 “향후 제미나이와 비오를 결합해 AI가 물리적 세계를 보다 깊이 이해할 수 있도록 진화시켜 나가겠다”고 밝혔다.
한편, 영상 생성 AI 시장에서는 이미 다양한 기업들이 경쟁 중이다. 메타는 지난해 10월 텍스트 입력만으로 최대 16초 분량 의 동영상을 생성하는 ‘무비 젠(MovieGen)’을 선보였고, 오픈AI는 12월 최대 1분 길이의 동영상을 생성할 수 있는 ‘소라(Sora)’를 출시했다. 또 다른 경쟁사인 런웨이(Runway)는 최근 4세대 AI 모델 ‘젠-4(Gen-4)’를 공개하며 주목받고 있으며, 3억 달러(약 4300억 원)의 투자도 유치한 상태다.
구글은 비오 2의 영상 길이는 비교적 짧지만, 다른 주요 영상 생성 AI 모델들과의 성능 비교에서 우수한 평가를 받았다고 강조하며, 신뢰성과 안전성 확보를 위한 내부 모니터링 및 정책도 강화하겠다고 밝혔다.
글 / 홍정민 news@cowave.kr
(c) 비교하고 잘 사는, 다나와 www.danawa.com