비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

AI가 최고의 '노이즈'를 찾아낸다... 삼성, 비디오 품질 높이는 ‘ANSE’ 기술 공개

2025.06.05. 14:12:03
조회 수
426
12
댓글 수
1

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Model Already Knows the Best Noise: Bayesian Active Noise Selection via Attention
in Video Diffusion Model


시간은 조금 더 걸리지만 비디오 품질은 확실히 좋아진다

비디오 생성 AI의 품질 향상을 위한 새로운 패러다임이 제시됐다. 삼성리서치가 개발한 ANSE(Active Noise Selection for Generation) 기술은 기존의 외부 설계된 노이즈 선택 방식과 달리, 모델 내부의 어텐션 메커니즘을 활용해 최적의 노이즈를 선택하는 혁신적인 접근 방식을 제안한다. ANSE 프레임워크의 핵심은 BANSA(Bayesian Active Noise Selection via Attention) 획득 함수다. 이 기술은 여러 확률적 어텐션 샘플 간의 엔트로피 불일치를 측정하여 모델의 신뢰도와 일관성을 추정한다. 연구진은 "낮은 BANSA 스코어를 가진 노이즈 시드를 선택함으로써 모델이 더 확신하고 일관된 어텐션 패턴을 보이며, 이는 경험적으로 일관된 비디오 생성과 상관관계가 있다"고 설명했다.

실험 결과, 코그비디오X-2B(CogVideoX-2B)에서 총 VBench 점수가 81.03에서 81.66으로 상승하며, 품질 점수는 0.48점, 의미적 정렬은 1.23점 향상됐다. 코그비디오X-5B에서도 품질 점수 0.17점, 의미 점수 0.60점, 총점 0.25점의 개선 효과를 보였다. 추론 시간은 각각 8%와 13% 증가에 그쳤다.


복잡한 계산 과정을 한 번에 끝내는 '스마트 마스킹' 기술

기존 방법들이 여러 번의 완전한 디퓨전 샘플링을 요구하여 상당한 계산 비용을 초래했다면, ANSE는 베르누이 마스킹 근사를 도입해 단일 디퓨전 스텝과 어텐션 레이어의 하위 집합만으로 스코어 추정을 가능하게 했다. 연구진은 "K개의 독립적인 순방향 패스 대신 이진 마스크를 어텐션 스코어에 직접 적용하여 계산 효율성을 크게 개선했다"고 밝혔다.

각 샘플 반복에서 베르누이(p) 분포에서 추출한 이진 마스크를 생성하여 마스킹된 어텐션 맵을 계산한다. 이 방식은 입력을 고정한 채 어텐션 패턴의 변동성을 시뮬레이션하여 불확실성 기반 노이즈 선택을 위한 실용적인 대안을 제공한다.

AI가 중요한 부분만 골라서 계산 시간 64% 단축

모든 어텐션 레이어를 사용하면 포괄적인 불확실성 추정이 가능하지만 깊은 텍스트-투-비디오 모델에서는 계산 부하가 크다. 연구진은 상관관계 기반 절단 전략을 제안하여 첫 d개 레이어(전체 레이어를 다 쓰지 않고도 결과가 거의 같게 나오는 최소한의 레이어 수 d*)의 평균 BANSA 스코어가 전체 레이어 스코어와 높은 상관관계를 유지하는 최소 깊이를 선택했다.

코그비디오X-2B에서는 레이어 14, 코그비디오X-5B에서는 레이어 19에서 0.7 임계값에 도달하여 이를 최적 깊이로 설정했다. 이를 통해 FreeInit이나 FreqPrior 같은 기존 방법들이 200% 추론 시간 증가를 초래하는 것에 비해 약 64%의 추론 비용 절감을 달성했다.

외부 도구 없이 AI 스스로 최적의 선택을 하는 방법

기존의 PYoCo, FreeNoise, FreeInit, FreqPrior 등의 방법들은 외부에서 설계된 사전 정보에 의존하며 후보 시드를 평가하기 위해 여러 번의 완전한 디퓨전 패스를 요구했다. 더 중요한 것은 이들이 어떤 노이즈 시드가 본질적으로 선호되는지를 나타내는 모델 내부 신호를 활용하지 못했다는 점이다.

ANSE는 분류 작업의 예측 분포와 달리 생성 디퓨전에서 텍스트와 시각적 토큰 간의 정렬이 자연스럽게 나타나는 어텐션 공간에서 불확실성을 추정한다. BANSA는 BALD와 유사하게 여러 어텐션 샘플에서 불일치와 신뢰도를 측정하지만, 생성 환경에 맞춰 조정됐다.

FAQ

Q: ANSE 기술이 기존 비디오 생성 AI와 어떻게 다른가요?

A: ANSE는 외부에서 설계된 노이즈 필터 대신 AI 모델 내부의 어텐션 메커니즘을 분석하여 최적의 노이즈를 선택합니다. 이를 통해 8-13%의 추론 시간 증가만으로 비디오 품질과 텍스트 정렬 성능을 크게 향상시킬 수 있습니다.

Q: BANSA 스코어는 무엇을 측정하나요?

A: BANSA 스코어는 AI 모델의 어텐션 패턴이 얼마나 일관되고 확신에 찬지를 측정합니다. 낮은 BANSA 스코어는 모델이 더 확신하고 일관된 어텐션을 보인다는 의미로, 이는 고품질 비디오 생성과 상관관계가 있습니다.

Q: 이 기술의 실제 활용 가능성은 어떤가요?

A: 삼성리서치에서 개발한 이 기술은 기존 비디오 생성 모델에 쉽게 통합 가능하며, 추가 학습이나 모델 수정 없이도 비디오 품질 개선이 가능합니다. 특히 추론 시간 증가가 최소화되어 실용적 활용도가 높습니다.

해당 기사에 인용된 논문 원문은 링크에서 확인 가능하다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
롤 TCG 리프트바운드, T1 우승 기념 컬렉션 공개 (1) 게임메카
대통령배 아마추어 e스포츠 대회, 광주 대표 선발전 모집 게임메카
소프트뱅크, 오픈AI 지분 담보 15조 원 대출 협상 재개…기업 보증 추가 AI matters
구글 탄소배출 1년 새 25% 급증…아마존도 16% 늘었다 (2) AI matters
AI 데이터센터 크루소, 4조 7천억 원 조달 협의…기업가치 46조 원 거론 (1) AI matters
테슬라, 직원 AI 지출 주 31만 원으로 제한…xAI 제품은 예외 AI matters
오픈AI, 미 정부에 지분 5% 제안…66조 원 규모 AI matters
[오늘의 스팀] 새로운 안전지대? 러스트 ‘아파트’ 생겼다 게임메카
소니에 이어, MS도 Xbox에서 실물 디스크 없앤다? 게임메카
[리뷰] 독특한 구성 속 탄탄한 기본기, 에이수스 프로아트 PZ14 IT동아
"10년 타기는 옛 말" 폐차 직전까지 21만km... LPG, 가장 오래 타는 차 (1) 오토헤럴드
현대차·기아, 美 상반기 88만대 돌파... 하이브리드로 역대급 기록 (1) 오토헤럴드
트럼프, USMCA 연장 거부 '자동차 원산지 규정 강화 가능성' 오토헤럴드
"브레이크 페달 없는 테슬라 나온다" 美 자율주행 규제 대수술 오토헤럴드
기아, 해양 폐플라스틱 EV3 트렁크 매트로 재탄생…오션클린업 협력 확대 오토헤럴드
[EV 트렌드] 'EV9·아이오닉 9 정조준' 테슬라 모델 Y L 미국 판매 시작 오토헤럴드
지커, 유럽서 EREV 카드 '들썩' 전기차 시장 둔화에 전략 수정 오토헤럴드
테슬라 독주·BYD 돌풍…6월 수입차 시장 판도 바꾼 전기차 50% 돌파 오토헤럴드
스텔란티스코리아, 개소세 인하 종료 대응 지프·푸조 7월 특별 프로모션 전개 글로벌오토뉴스
가상 세계에서 태어나는 자동차, 현대차 남양연구소 AMS동을 가다 (1) 글로벌오토뉴스
이 시간 HOT 댓글!
1/4