오픈AI(OpenAI)가 9일(현지시간) 텍스트를 기반으로 현실적인 동영상을 생성하는 AI 모델 '소라(Sora)'의 새로운 버전인 '소라 터보(Sora Turbo)'를 공개했다. 2월에 선보인 기존 모델보다 처리 속도가 크게 개선됐으며, 챗GPT(ChatGPT) 플러스와 프로 사용자들은 소라 공식 홈페이지를 통해 즉시 이용할 수 있다.
현실 세계 시뮬레이션을 위한 기반 기술
소라는 현실 세계를 이해하고 시뮬레이션하는 AI 개발의 중요한 기반이 되는 기술이다. 물리적 세계와 상호작용할 수 있는 모델 개발을 위한 핵심 단계로 평가받고 있다.
향상된 기능과 새로운 인터페이스
소라 터보는 최대 1080p 해상도의 영상을 20초까지 제작할 수 있다. 와이드스크린, 세로, 정사각형 비율을 지원하며 사용자가 직접 에셋을 가져와 확장, 리믹스, 블렌딩할 수 있다.
오픈AI는 텍스트, 이미지, 영상을 통한 프롬프트 입력을 더욱 쉽게 만들었다. 스토리보드 도구를 통해 각 프레임별로 세부적인 입력이 가능하며, 커뮤니티에서 제작된 콘텐츠를 실시간으로 확인할 수 있는 피처드(Featured)와 최근(Recent) 피드도 제공한다.
구독 정책과 요금제
챗GPT 플러스 사용자는 추가 비용 없이 매월 480p 해상도 영상 50개 또는 720p 해상도 영상을 더 적은 수량으로 생성할 수 있다. 프로 요금제 사용자는 이용량이 10배 증가하며, 더 높은 해상도와 긴 영상 제작이 가능하다.
챗GPT 팀, 엔터프라이즈, 교육용 버전에서는 소라를 이용할 수 없으며, 18세 미만 사용자도 서비스 이용이 제한된다. 현재 영국, 스위스, 유럽경제지역(EEA)에서는 서비스가 제공되지 않지만, 오픈AI는 향후 몇 달 내에 서비스 지역을 확대할 계획이다.
안전성과 제한사항
현재 버전의 소라는 여러 제한사항을 가지고 있다. 비현실적인 물리 현상을 생성하거나 복잡한 동작을 장시간 구현하는 데 어려움이 있다. 소라 터보가 2월 공개 버전보다 빨라졌지만, 여전히 모든 사용자가 저렴하게 이용할 수 있는 수준까지 개선이 필요한 상황이다.
콘텐츠 안전성 확보를 위한 조치
모든 소라 생성 영상에는 C2PA 메타데이터가 포함되어 출처를 확인할 수 있으며, 기본적으로 워터마크가 표시된다. 오픈AI는 생성물의 기술적 특성을 사용해 소라에서 제작된 콘텐츠인지 확인할 수 있는 내부 검색 도구도 개발했다.
아동 성학대 자료나 성적 딥페이크와 같은 유해 콘텐츠는 차단되며, 초기에는 인물 업로드가 제한적으로 허용된다. 오픈AI는 딥페이크 방지 기술을 개선하면서 점진적으로 이 기능을 더 많은 사용자에게 제공할 예정이다.
NGO 및 연구기관과의 협력
오픈AI는 향후 NGO 및 연구기관과 협력해 출처 확인 생태계를 발전시키고 개선할 계획이다. 이는 디지털 콘텐츠에 대한 신뢰를 구축하고 사용자들이 진정성 있는 창작물을 인식하는 데 필수적인 도구가 될 것으로 기대된다.
오픈AI는 소라의 광범위한 활용을 준비하기 위해 허위정보, 불법 콘텐츠, 안전성 분야의 전문가들과 협력해 모델을 엄격하게 테스트했다. 이들의 피드백은 소라의 안전장치를 미세 조정하는 데 중요한 역할을 했으며, 챗GPT, DALL·E, API 제품을 통해 개발되고 개선된 강력한 안전 시스템을 기반으로 구축됐다.
오픈AI는 내년 초 다양한 사용자층을 위한 맞춤형 가격 정책을 도입할 예정이며, 소라를 통해 전 세계 사람들이 새로운 형태의 창의성을 탐구하고 자신의 이야기를 전달하며 동영상 스토리텔링의 경계를 넓힐 수 있기를 기대한다고 밝혔다.
소라 터보에 대한 자세한 사항은 오픈AI에서 확인할 수 있다.
기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.
AI Matters 뉴스레터 구독하기