비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

AI가 최고의 '노이즈'를 찾아낸다... 삼성, 비디오 품질 높이는 ‘ANSE’ 기술 공개

2025.06.05. 14:12:03
조회 수
368
12
댓글 수
1

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Model Already Knows the Best Noise: Bayesian Active Noise Selection via Attention
in Video Diffusion Model


시간은 조금 더 걸리지만 비디오 품질은 확실히 좋아진다

비디오 생성 AI의 품질 향상을 위한 새로운 패러다임이 제시됐다. 삼성리서치가 개발한 ANSE(Active Noise Selection for Generation) 기술은 기존의 외부 설계된 노이즈 선택 방식과 달리, 모델 내부의 어텐션 메커니즘을 활용해 최적의 노이즈를 선택하는 혁신적인 접근 방식을 제안한다. ANSE 프레임워크의 핵심은 BANSA(Bayesian Active Noise Selection via Attention) 획득 함수다. 이 기술은 여러 확률적 어텐션 샘플 간의 엔트로피 불일치를 측정하여 모델의 신뢰도와 일관성을 추정한다. 연구진은 "낮은 BANSA 스코어를 가진 노이즈 시드를 선택함으로써 모델이 더 확신하고 일관된 어텐션 패턴을 보이며, 이는 경험적으로 일관된 비디오 생성과 상관관계가 있다"고 설명했다.

실험 결과, 코그비디오X-2B(CogVideoX-2B)에서 총 VBench 점수가 81.03에서 81.66으로 상승하며, 품질 점수는 0.48점, 의미적 정렬은 1.23점 향상됐다. 코그비디오X-5B에서도 품질 점수 0.17점, 의미 점수 0.60점, 총점 0.25점의 개선 효과를 보였다. 추론 시간은 각각 8%와 13% 증가에 그쳤다.


복잡한 계산 과정을 한 번에 끝내는 '스마트 마스킹' 기술

기존 방법들이 여러 번의 완전한 디퓨전 샘플링을 요구하여 상당한 계산 비용을 초래했다면, ANSE는 베르누이 마스킹 근사를 도입해 단일 디퓨전 스텝과 어텐션 레이어의 하위 집합만으로 스코어 추정을 가능하게 했다. 연구진은 "K개의 독립적인 순방향 패스 대신 이진 마스크를 어텐션 스코어에 직접 적용하여 계산 효율성을 크게 개선했다"고 밝혔다.

각 샘플 반복에서 베르누이(p) 분포에서 추출한 이진 마스크를 생성하여 마스킹된 어텐션 맵을 계산한다. 이 방식은 입력을 고정한 채 어텐션 패턴의 변동성을 시뮬레이션하여 불확실성 기반 노이즈 선택을 위한 실용적인 대안을 제공한다.

AI가 중요한 부분만 골라서 계산 시간 64% 단축

모든 어텐션 레이어를 사용하면 포괄적인 불확실성 추정이 가능하지만 깊은 텍스트-투-비디오 모델에서는 계산 부하가 크다. 연구진은 상관관계 기반 절단 전략을 제안하여 첫 d개 레이어(전체 레이어를 다 쓰지 않고도 결과가 거의 같게 나오는 최소한의 레이어 수 d*)의 평균 BANSA 스코어가 전체 레이어 스코어와 높은 상관관계를 유지하는 최소 깊이를 선택했다.

코그비디오X-2B에서는 레이어 14, 코그비디오X-5B에서는 레이어 19에서 0.7 임계값에 도달하여 이를 최적 깊이로 설정했다. 이를 통해 FreeInit이나 FreqPrior 같은 기존 방법들이 200% 추론 시간 증가를 초래하는 것에 비해 약 64%의 추론 비용 절감을 달성했다.

외부 도구 없이 AI 스스로 최적의 선택을 하는 방법

기존의 PYoCo, FreeNoise, FreeInit, FreqPrior 등의 방법들은 외부에서 설계된 사전 정보에 의존하며 후보 시드를 평가하기 위해 여러 번의 완전한 디퓨전 패스를 요구했다. 더 중요한 것은 이들이 어떤 노이즈 시드가 본질적으로 선호되는지를 나타내는 모델 내부 신호를 활용하지 못했다는 점이다.

ANSE는 분류 작업의 예측 분포와 달리 생성 디퓨전에서 텍스트와 시각적 토큰 간의 정렬이 자연스럽게 나타나는 어텐션 공간에서 불확실성을 추정한다. BANSA는 BALD와 유사하게 여러 어텐션 샘플에서 불일치와 신뢰도를 측정하지만, 생성 환경에 맞춰 조정됐다.

FAQ

Q: ANSE 기술이 기존 비디오 생성 AI와 어떻게 다른가요?

A: ANSE는 외부에서 설계된 노이즈 필터 대신 AI 모델 내부의 어텐션 메커니즘을 분석하여 최적의 노이즈를 선택합니다. 이를 통해 8-13%의 추론 시간 증가만으로 비디오 품질과 텍스트 정렬 성능을 크게 향상시킬 수 있습니다.

Q: BANSA 스코어는 무엇을 측정하나요?

A: BANSA 스코어는 AI 모델의 어텐션 패턴이 얼마나 일관되고 확신에 찬지를 측정합니다. 낮은 BANSA 스코어는 모델이 더 확신하고 일관된 어텐션을 보인다는 의미로, 이는 고품질 비디오 생성과 상관관계가 있습니다.

Q: 이 기술의 실제 활용 가능성은 어떤가요?

A: 삼성리서치에서 개발한 이 기술은 기존 비디오 생성 모델에 쉽게 통합 가능하며, 추가 학습이나 모델 수정 없이도 비디오 품질 개선이 가능합니다. 특히 추론 시간 증가가 최소화되어 실용적 활용도가 높습니다.

해당 기사에 인용된 논문 원문은 링크에서 확인 가능하다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
[이구동성] 쇠더룬드 회장이 이끄는 넥슨 '7조' 원정대 게임메카
김태곤 신작 MMO, 타이틀명 '임진왜란: 조선의 반격' 확정 (1) 게임메카
100% 전기차 르노 세닉 E-테크, ‘2026 올해의 차' 주요 자동차 시상식 2관왕 오토헤럴드
'6년은 타야 본전' 기아 텔루라이드 하이브리드 연비·가격 공개  오토헤럴드
BMW 올리버 집세 회장, ‘2026 월드 카 어워즈 올해의 인물' 선정 오토헤럴드
값 내리자 일주일 만에 1000대…볼보 EX30 계약 급증 오토헤럴드
푸조 올 뉴 3008 스마트 하이브리드, ‘2026 올해의 차 디자인’ 2관왕 오토헤럴드
포르쉐 K1 전기차 계획 철회 'V6·V8 내연기관으로 2028년' 출시 오토헤럴드
사이버캡 양산 직후 총괄 매니저 퇴사 '테슬라 리더십 공백 확대' 오토헤럴드
'AI 수소 시티' 본격화, 현대차그룹 새만금 미래기술 기지 건설 오토헤럴드
대한항공-영국 스카이포츠, 상용 eVTOL 운영 플랫폼 개발 파트너십 체결 글로벌오토뉴스
애스톤 마틴, 실적 부진에 인력 20% 감축 및 EV 투자 축소 글로벌오토뉴스
현대차그룹 대학생 교육봉사단 ‘현대점프스쿨’ 13기 발대식 개최 글로벌오토뉴스
푸조, 2026 WEC 출격할 ‘9X8’ 신규 리버리 공개 글로벌오토뉴스
익숙한 차가 지루해진 시대…’르노 필랑트’가 던진 변화의 신호 글로벌오토뉴스
엔드게임 확 바뀐다, 패스 오브 엑자일 '허상' 3월 7일 시작 게임메카
데브시스터즈, 삼성전자와 협업해 ‘갤럭시 S26 시리즈’ 스페셜 테마 선보인다 게임동아
위메이드의 글로벌 e스포츠 토너먼트 ‘이미르컵 월드 챔피언십’, 오는 28일 개최! 게임동아
PvP 대전, 위메이드 이미르컵 월드 챔피언십 28일 개최 게임메카
10주년 맞은 스타듀 밸리, 새 로맨스 대상 2인 공개 게임메카
이 시간 HOT 댓글!
1/4