비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

텐센트, AI 영상에 사실적 음향 입히는 ‘훈위안 비디오-폴리’ 공개

다나와
2025.09.03. 09:58:50
조회 수
160
3

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

출처 : 챗GPT 생성 이미지


 8월 28일(현지시간) 중국 텐센트 산하 훈위안 연구소가 AI 영상에 생생한 소리를 입히는 신기술 ‘훈위안 비디오-폴리(Hunyuan Video-Foley)’를 선보였다. 이 시스템은 영상 속 장면을 분석해 실제와 같은 고품질 음향을 생성하고, 화면 속 동작과 완벽하게 동기화된 사운드트랙을 자동으로 만들어낸다.



출처 : 유튜브 채널 'ComfyUI Workflow Blog'


 그간 AI가 만든 영상은 시각적으로는 인상적이지만 종종 음향이 부재해 몰입감을 떨어뜨리는 경우가 많았다. 영화 산업에서는 이러한 빈 공간을 ‘폴리(Foley)’라 불리는 전문 음향 작업으로 채운다. 잎사귀가 스치는 소리, 천둥 소리, 유리잔이 부딪히는 소리 등 장면에 맞춘 세밀한 효과음을 넣는 작업이다. 하지만 이 수준의 사실성을 AI가 구현하는 것은 쉽지 않았다.


 훈위안 연구팀은 기존 ‘영상-음향 변환(V2A)’ 모델이 겪어온 문제를 ‘모달리티 불균형(modality imbalance)’으로 판단했다. AI가 실제 영상보다는 텍스트 지시에 더 의존하다 보니, 장면에 담긴 세부 사운드를 놓치는 경우가 많았던 것이다.


 예를 들어, 해변가에서 사람들이 걷고 갈매기가 날아다니는 영상에 단순히 “파도 소리”라는 텍스트 지시를 주면, 모델은 파도 소리만 내보내고 발자국 소리나 새소리는 무시해 장면이 부자연스러워졌다.   방식을 채택했다.


출처 : 훈위안 X계정



1. 대규모 학습 데이터 구축

 10만 시간 분량의 영상·음향·텍스트 설명을 담은 라이브러리를 제작하고 자동화된 필터링 파이프라인을 통해 저품질 콘텐츠, 긴 무음 구간, 압축된 음성 등을 제거해 학습 데이터의 질을 보장했다.


2. 스마트한 AI 구조 설계

 AI모델이 영상과 음향의 연관성을 먼저 정밀하게 파악해 타이밍을 맞춘 뒤, 텍스트 프롬프트를 반영해 장면의 맥락과 분위기를 이해하도록 설계했다. 덕분에 구체적인 동작과 배경음이 놓치지 않고 구현된다.


3. 고품질 음향 보장 기법(REPA)

 ‘표현 정렬(Representation Alignment·REPA)’이라는 훈련 방식을 적용해, 사운드 엔지니어의 감수처럼 전문급 사전 학습 오디오 모델과 비교하며 더 깨끗하고 풍부한 소리를 생성할 수 있도록 했다.


 이 기술은 무성에 가까웠던 AI 영상에 몰입감 있는 음향을 입힘으로써, 자동화 콘텐츠 제작의 새로운 지평을 열 것으로 기대된다. 영화 제작자, 애니메이터, 크리에이터들에게 폴리 아트의 마법을 자동화된 방식으로 구현할 수 있는 유용한 도구가 될 전망이다.



글 / 김지훈 news@cowave.kr

(c) 비교하고 잘 사는, 다나와 www.danawa.com

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
저작권 안내
크리에이트 커먼즈 저작자 표시 필수 상업성 이용 불가 컨텐츠 변경 불가
저작권 안내
저작권 표시 필수
상업성 이용 불가
컨텐츠 변경 불가
* 본 내용은 위의 조건을 충족할 시, 별도의 허가 없이 사용이 가능합니다.
최신 일반뉴스 전체 둘러보기
1/1
AI뉴스 ICPC 만점, Grok 4 Fast, AI_TOP_100, Figma AI, 구글 AP2, WanAnimate, Meta Connect 등 동영상 있음 조코딩 JoCoding
구글, 저가형 ‘AI 플러스’ 요금제 40여 개국으로 확대...챗GPT와 신흥국 시장 확대 경쟁 중 다나와
챗GPT로 만든 가짜 스마트폰 사용 데이터, 실제와 얼마나 비슷할까? AI matters
"AI가 쥐만 못해?"… 쥐의 뇌 활동 데이터로 AI 시각 능력 평가하는 새 벤치마크 등장 AI matters
AI가 인간 가치관 바꿀 수도... 영국 대학 연구진 "지속 관리 필요" AI matters
AI 답변 속 광고 심는 기술 vs 탐지 기술… AI 챗봇 답변 속 숨은 광고, 알아차릴 수 있을까? AI matters
"예측 가능한 글만 살아남는다"... AI 검색이 웹사이트를 선택하는 기준 AI matters
"AI 도구 도입하면 끝?" 착각하는 회사들... 구글이 알려주는 AI 도입 성공 전략 7가지 AI matters
예시 10개 줘도 소용없다... AI가 일반인 문체 흉내내지 못하는 진짜 이유 AI matters
AI 비서, 정말 쓸모 있을까?… AI 에이전트 활용 방해하는 5가지 장벽 AI matters
‘연간 1000억달러 손실’… 생성형 AI 비용 90% 급락하며 가짜정보 홍수 AI matters
대학생들이 증명한 AI 교육 효과... 챗봇 활용 학생 100% "학습 향상" 체감 AI matters
메타·MS·구글 XR 기기 보안 테스트해봤더니… 가짜 광고·잘못된 지시 등 취약점 발견 AI matters
기업 64%가 AI로 친환경 추진, 하지만 환경 영향 우려는 더 커져 AI matters
기업 임원 98%가 IT팀 몰래 클라우드·AI 서비스 구매… 비용-보안 문제 야기한다 AI matters
글로벌 은행들의 AI 연구 투자 7배 급증... "선두 5개 은행이 65% 장악" AI matters
"5분이면 완성"... 가상 인플루언서 제작하는 AI 시스템 등장 AI matters
한국, ‘AI 아시아 허브’ 비전 가속화…엔터테인먼트와의 융합까지 확대 다나와
MIT, AI 기반 신소재 설계 도구 ‘SCIGEN’ 공개…차세대 전자·광학 혁신 이끈다 다나와
챗GPT 추천받는 기업 vs 외면받는 기업, 그 차이는? AI matters
이 시간 HOT 댓글!
1/4