
출처 : 챗GPT 생성 이미지
오픈AI(OpenAI)가 텍스트나 오디오 프롬프트를 기반으로 음악을 자동 생성하는 새로운 도구를 개발 중인 것으로 알려졌다. 테크크런치에 따르면 미국 IT 전문매체 '더 인포메이션(The Information)'은 “이 도구는 영상에 음악을 추가하거나 보컬 트랙에 기타 반주를 덧입히는 등 다양한 방식으로 활용될 수 있다”고 보도했다.
현재 이 도구가 언제 공개될지는 확정되지 않았으며, 별도의 독립형 제품으로 출시될지, 아니면 오픈AI의 챗GPT(ChatGPT)나 영상 생성 앱 소라(Sora)에 통합될지는 아직 불투명하다. 다만 오픈AI가 줄리아드 음악학교 학생들과 협력해 악보에 주석을 달며 학습 데이터를 구축하고 있다는 점이 알려졌다.

출처 : 챗GPT 생성 이미지
오픈AI는 과거에도 음악 생성 모델을 실험적으로 선보인 적이 있으나, 이는 챗GPT 출시 이전의 프로젝트였다. 최근에는 텍스트를 음성으로 변환하거나 음성을 텍스트로 인식하는 오디오 모델 개발에 집중해 왔다. 음악 AI 분야는 이미 수노, 유마닉(Yumanic), 구글의 ‘뮤직LM’ 등 여러 스타트업과 빅테크가 주도하고 있지만, 오픈AI가 보유한 대규모 멀티모달 학습 인프라와 자연어 이해력은 차별화된 경쟁력이 될 것으로 전망된다.
전문가들은 오픈AI가 영상 생성 모델 ‘소라’와 언어모델 ‘GPT’에서 보여준 수준 높은 멀티모달 기술력을 음악 분야로 확장하려는 것으로 분석한다. 특히 영상·음성·음악을 하나의 맥락에서 통합 처리할 수 있는 능력이 확보될 경우, 콘텐츠 제작의 패러다임을 근본적으로 바꿀 가능성이 크다는 평가다.
글 / 김지훈 news@cowave.kr
(c) 비교하고 잘 사는, 다나와 www.danawa.com












