모션 캡처가 필요 없다! 걷고, 앉고, 기타 치고...AI가 스스로 배우는 자연스러운 동작 생성 기술 : 다나와 DPG는 내맘을 디피지

ZeroHSI: Zero-Shot 4D Human-Scene Interaction by Video Generation

모션 캡처 없이도 자연스러운 가상 캐릭터 움직임 구현

북경대학교 Hongjie Li 연구원과 스탠포드대학교 Hong-Xing Yu 연구원이 공동 1저자로 참여한 연구팀이 3D 가상공간에서 사람과 환경의 자연스러운 상호작용을 생성하는 혁신적인 기술을 개발했다. 이 기술은 엠바디드 AI(Embodied AI), 가상현실(VR), 로봇공학 분야의 핵심 과제인 인간-환경 상호작용(Human-Scene Interaction, HSI) 생성 문제를 해결했다는 평가를 받고 있다.

기존 가상 캐릭터 기술의 한계점 극복

기존의 HSI 생성 연구는 크게 두 가지 방향으로 진행됐다.

첫째는 정적인 3D 공간에서의 상호작용에 초점을 맞춘 연구로, 모션 디퓨전 모델(Motion Diffusion Model)을 활용해 3D 공간과 모션 캡처 데이터를 학습시켰다. 그러나 이 방식은 흔한 동작인 걷기나 앉기조차도 다른 환경에 일반화하기 어려웠다.

둘째는 동적 물체 조작에 중점을 둔 연구다. 이 접근법은 같은 종류의 물체 내에서는 일반화가 가능했지만, 형태가 크게 다른 물체는 다루지 못했다. 두 방향 모두 3D 공간과 모션 캡처 데이터가 쌍으로 구성된 데이터셋에 의존한다는 근본적 한계가 있었다.

영상 생성 AI와 3D 기술의 혁신적 결합

연구진이 개발한 'ZeroHSI'는 기존 방식과 달리 최신 영상 생성 AI 모델이 학습한 풍부한 동작 정보를 활용한다. 이 모델들은 방대한 양의 자연스러운 인간 동작과 상호작용이 포함된 영상을 학습했기 때문에, 다양한 3D 환경에서 맥락에 맞는 자연스러운 동작을 생성할 수 있다.

이 기술은 3D 가우시안 스플래팅(3D Gaussian Splatting) 기술을 기반으로 구현됐다. 시스템은 먼저 3D 공간을 입력받아 애니메이션이 가능한 아바타를 초기화하고, 프레임별로 상대적 카메라 변환을 순차적으로 추정한다. 이후 생성된 비디오를 참조하여 프레임별로 인간 포즈 파라미터를 최적화하고, VPoser를 활용한 인간 포즈 사전 정보를 통해 자연스러운 동작을 생성한다. 이 방식으로 정적인 환경뿐 아니라 움직이는 물체와의 상호작용도 자연스럽게 구현할 수 있다.

12개 실내외 환경에서 입증된 자연스러운 상호작용

연구진은 기술 평가를 위해 "AnyInteraction"이라는 새로운 벤치마크 데이터셋을 구축했다. 이 데이터셋은 침실, 거실, 체육관, 바, 놀이터, 온실, 카페, 상점 등 총 12개의 서로 다른 3D 환경으로 구성되었으며, 이 중 7개는 실내 환경, 5개는 실외 환경이다. 특히 Mip-NeRF 360과 Tanks and Temples 데이터셋의 실제 장면을 활용하여 현실감을 높였다.

정량적 평가에서 ZeroHSI는 TRUMANS와 LINGO 등 기존 방식들보다 더 나은 의미론적 정렬(Semantic Alignment)과 동작 다양성, 물리적 타당성을 보여줬다. 실제 구현된 상호작용은 정적 환경에서의 걷기, 앉기, 청소하기부터 동적 물체와의 상호작용인 식물 물주기, 꽃병 들기, 잔디깎기, 기타 연주에 이르기까지 다양했다. 특히 동적 물체와의 상호작용에서 ZeroHSI는 CHOIS와 LINGO 대비 높은 접촉률과 낮은 물체 관통률을 기록했다. 400명의 참가자를 대상으로 한 평가에서도 정적 및 동적 시나리오 모두에서 기존 방식들보다 더 자연스럽고 의도한 동작과 잘 부합한다는 평가를 받았다.

메타버스와 로봇공학의 새 지평을 열다

현재 ZeroHSI는 동작 시퀀스당 약 1시간의 처리 시간이 필요해 실시간 응용에는 제약이 있으며, 미세한 물체와의 상호작용에서는 신뢰할 수 있는 시각적 감독이 어렵다는 한계가 있다. 또한 생성된 동작의 품질이 영상 생성 모델의 성능에 의존적이나, 비디오 생성 기술의 빠른 발전으로 이러한 한계는 점차 극복될 것으로 예상된다.

이 기술은 VR/AR에서 더 자연스러운 아바타 움직임 구현, 로봇공학에서의 동작 계획 수립, 메타버스의 실감형 캐릭터 제어 등 다양한 분야에서 활용될 수 있다. 특히 모션 캡처 데이터 없이도 자연스러운 인간-환경 상호작용을 생성할 수 있다는 점에서, 가상 환경에서의 인간 행동 시뮬레이션 분야에 새로운 지평을 열었다는 평가를 받고 있다.

해당 논문의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

10년 전에 구매한 SSD, 이제 놓아줘야 할까요? [이젠 바꿨으면 좋겠네]	다나와
[2025 서울모빌리티쇼] 현대차, 2세대 넥쏘 등 친환경차 풀라인업 공개	오토헤럴드
[2025 서울모빌리티쇼] 제네시스 'X 그란 쿠페 및 컨버터블' 세계 최초 공개	오토헤럴드
[2025 서울모빌리티쇼] 현대차, ‘디 올 뉴 넥쏘’·‘더 뉴 아이오닉 6’ 세계 최초 공개	오토헤럴드
[2025 서울모빌리티쇼] 월드프리이머 5종... 신차부터 미래 기술까지 총망라	오토헤럴드
[2025 서울모빌리티쇼] 포르쉐, ‘신형 911 카레라 4 GTS' 국내 최초 공개	오토헤럴드
[2025 서울모빌리티쇼] 벤츠,극강의 퍼포먼스 신형 AMG GT 국내 최초 공개	오토헤럴드
[2025 서울모빌리티쇼] HD현대, 40톤·24톤급 스마트 굴착기 세계 최초 공개	오토헤럴드
[2025 서울모빌리티쇼] BMW, 뉴 i4 M50 xDrive 그란 쿠페 국내 최초 공개	오토헤럴드
[2025 서울모빌리티쇼] 미니, ‘JCW·쿠퍼 컨버터블’ 국내 최초 공개	오토헤럴드
[2025 서울모빌리티쇼] BMW 모토라드, ‘뉴 S 1000 RR’과 ‘M 1000 XR’ 공개	오토헤럴드
[2025 서울모빌리티쇼] 기아, 혁신적 모빌리티 라이프’ 제시… ‘PV5’ 첫 공개	오토헤럴드
[2025 서울모빌리티쇼] BYD, 중형 전기세단 '씰' 공개... 사전예약 돌입	오토헤럴드
도쿄 숙소 고민 끝! 후회 없을 프린스 호텔 3	트래비
페이데이보다 높은 자유도로 하이스트 정상 노린다 (1)	게임메카
샤오미 SU7 사고 직후 폭발로 20대 여성 3명 불에 타 숨져 동영상 있음	오토기어
애플의 새 혁신 아이패드 긴급 공수 동영상 있음	UnderKG
[2025 서울모빌리티쇼] 봄 나들이, 아이와 함께 딱 좋은 체험형 콘텐츠 주목 (1)	오토헤럴드
8년 만에 결국 도산한 카누와 전기차에 진심이었던 BMW 동영상 있음	오토기어
[자동차와 法] 모빌리티 시대, 우리가 미처 몰랐던 도로교통 관련 규정 (1)	IT동아
[2025 서울모빌리티쇼] BYD코리아, 전동화 기술 리더십 과시 및 소통 강화	오토헤럴드
[2025 서울모빌리티쇼] BMW 코리아, i4 M50·iX M70 국내 최초 공개	오토헤럴드
[2025 서울모빌리티쇼] 자동차 이상으로 빛날 부품기업들의 도전 현장	오토헤럴드
이탈리아 '시칠리아'에서 경험해야 할 것들 (2)	트래비
아직 당신이 모르는 스페인 소도시 (2)	트래비
[가이드] “자동 채집, 가방 무게”... 소소하게 써먹는 마비노기 모바일 잡기술들! (1)	게임동아
[2025 서울모빌리티쇼] 대한민국 자율주행 기술의 현재와 미래 한자리에 (4)	오토헤럴드
Z세대의 코카-콜라 음료 즐기는 법 (5)	마시즘
70급 그래픽카드 지포스 RTX 5070/라데온 RX9070XT, 100만원 시대가 왔다 동영상 있음	보드나라
뚜따 안 하고 그냥 CPU위에 리퀴드 메탈 바르면 온도 몇 도 떨어질까? (1) 동영상 있음	민티저
아끼던 LG OLED TV 고장났습니다, 패널 교체 얼마? #oledtv 동영상 있음	DmonkTV
"황금알인줄 알았는데.." 근심만 쌓여 가는 자율 주행 시장 동영상 있음	오토기어
독창적인 기능과 디자인. 마이크로닉스 2025 신제품 발표회 (2)	기글하드웨어
진정한 게이밍PC란 이런 것!! 유저들과 함께 한 'MSI 익스피리언스 데이' (2)	미디어픽
걷기 좋은 속초, 상도문돌담마을 (3)	트래비
최신 IT 제품에 이벤트까지...볼거리, 즐길거리 다양했던 '2025 인텔 & 다나와 아카데미 페스티벌' (1)	미디어픽
키보드의 현재와 미래를 엿보다 '서울 기계식 키보드 박람회 2025' (3)	미디어픽
고성능 노트북 CPU 세대교체? 라이젠 9 9955HX3D 성능 유출 및 출시 무산된 하이퍼스레딩 없는 인텔 프로세서의 존재 등 주요 소식 정리 (9)	다나와
혁신에 혁신을 더하다 '마이크로닉스 2025년 신제품 발표회' (2)	미디어픽
차세대 하드웨어 대응하는 신제품 공개, 2025 마이크로닉스 신제품 발표회 (1)	블루프레임
럭셔리한 마카오 여행을 꿈꾼다면, 그랜드 리스보아 팰리스 (3)	트래비
‘파도 대신 능선을 걷다’ 바다만큼 아름다운 하와이 트레킹 코스 5 (5)	트래비
물의 뭍 '남원'에서 가볼 만한 곳 8 (6)	트래비
[마이크로닉스 2025 발표회] 소리없는 강자 실버스톤, 진짜 기술을 정의하다 (2)	위클리포스트
[마이크로닉스 2025 발표회] 묵직한 개막, 예상 밖의 반전! (3)	위클리포스트
HYTE, 브랜드를 넘어 문화가 되다. APAC 매니저 Regina Zhao & Felix Chou 인터뷰	위클리포스트
[이슈+] 라데온 RX 9070ㆍRX 9070 XT는 어떻게 분위기 반전에 성공했나? (4)	위클리포스트
[SECON 2025] 오우션 테크놀러지 김정균 이사 "기억을 위한 기술, 기록을 넘어서다"	위클리포스트
[SECON 2025] 위드앤아이티 강명일 대표 - QSAN 유니파이드 스토리지 이야기	위클리포스트
[SECON 2025] 대한CNI 우종현 CTO - 디지털 자산의 수호 방식	위클리포스트
[SECON 2025] 한결피아이에프(한결PIF) 정승진 부장 - 브로케이드 사례로 보는 네트워크 진화	위클리포스트
[SECON 2025] 래안텍 조정호 이사 - 저장의 무게를 다시 묻다	위클리포스트
스토리지 혁신의 게임 체인저, 래안텍 신은정 대표 씨게이트 손 잡고 잰걸음!	위클리포스트
[르뽀] 모터사이클 "돈이 아깝지 않은 필수 과정" 혼다 에듀케이션 센터	오토헤럴드
저장장치계의 자강두천! WD와 씨게이트의 전쟁은 계속된다! [라이벌열전] (14)	다나와
'실사 그래픽의 인생 시뮬레이션 게임' <인조이 inZOI> 출시 PC버전 요구 사양 프리뷰 (16)	다나와
[순정남] 최약캐도 내가 잡으면 사기캐 TOP 5 (3)	게임메카
울퉁불퉁 도로의 포트홀, 해바라기유로 고친다? (2)	과학향기
진정한 게이밍PC란 이런 것!! 유저들과 함께 한 'MSI 익스피리언스 데이' (2)	미디어픽
인텔 코어 i5-14400F vs AMD 라이젠 5 7600: 게이밍 최강자는 누구? (3)	뉴스탭
노드VPN으로 경험해 본 해외 서비스 접속기 (2)	IT동아
[뉴스줌인] 허가 없이 쓰는 비면허 주파수, 어떻게 활용되나 (2)	IT동아
[르포] AI가 주도하는 보안 시장…세계 보안 엑스포 (1)	IT동아
포르쉐 신형 911, 서울모빌리티쇼서 국내 최초 공개… 전기 SUV 마칸도 (1)	오토헤럴드
차봇모터스, 서울모빌리티쇼서 그레나디어 포털액슬 프로토 타입 공개 (1)	오토헤럴드
철원의 봄이 피려던 어느 날, 한탄강 주상절리길 (3)	트래비
서울시립대 & 다나와 아카데미 페스티벌에서 만난 마이크로닉스 부스	브레인박스
케이스 일진, 서울 시립대를 접수하다. - 다나와 아카데미 페스티벌 행사 다크플래쉬 부스	브레인박스
[포토] 기계식 키보드도 이 정도면 작품이네 (1)	게임메카
'타타신지'아세요? 대만 여행의 정석	트래비
그 옛날 공룡이 살던 섬, 사도	트래비
[BOOK] 프랑스 성당이 궁금하다면	트래비
스토리지 용량과 보안 두 마리 토끼 잡은, 씨게이트 (10)	다나와
[인터뷰] 네오플이 밝힌 ‘카잔’의 철학 “플레이만으로 모든 액션을 느낄 수 있을 것” (1)	게임동아
접히는 아이폰부터 가성비 스마트폰까지… 요즘 주목할 IT 루머 및 소식 모음 (9)	다나와
서울시립대에서 열린 11개 IT 브랜드의 향연, 2025 인텔&다나와 아카데미 페스티벌 (5)	다나와
"아토3가 벌써 구형이 되었다고? 중국 자율 주행 정말 엄청난가?" 중국 12년 거주 현지인에게 듣다 동영상 있음	오토기어
몬스터헌터 : 와일즈 FHD 상옵 이상 가능한 가성비 게이밍 PC (11)	다나와
음료로 보는 ‘좋은 사람 도감’ (5)	마시즘
교황님이 악마의 음료 ‘커피’에 세례를 주지 않았다면 (7)	마시즘
인텔의 새로운 CEO 립부 탄 그는 누구인가, 인텔은 위기를 극복할 수 있을까 동영상 있음	보드나라
또 다시 연기된 지포스 RTX 5060 및 PCI-E 7.0 개발 시동 소식 등 주요 소식 정리 (10)	다나와
12년 거주 현지인에게 듣는 "중국 전기차의 실체" (1) 동영상 있음	오토기어
에어팟 프로3 루머 총정리 \| 이번엔 터치스크린 케이스? 뭐 카메라?? (2) 동영상 있음	고나고
2025 다나와 아카데미 페스티벌 참관기 (2)	기글하드웨어
[다나와 아카데미 2025] 마이크로닉스 김희철 매니저 “대학생과의 직접 소통이 핵심”	위클리포스트
[다나와 아카데미 2025] ACER 김홍철 부장 "소비자 피드백은 제품 기획에 중요"	위클리포스트
[다나와 아카데미 2025] 다크플래쉬 황인성 부장 "대학생은 트렌드를 이끄는 핵심"	위클리포스트
[다나와 아카데미 2025] 서울시립대에서 성료… IT 브랜드와 소비자 오프라인 접점	위클리포스트
[이슈+] AMD Ryzen 7 7700 vs Ryzen 7 PRO 7745, 이름만 다를 뿐 같은 성능? (2)	위클리포스트
[친절한 IT] 라이젠 + 라데온 PC조립 '게임 가이드' 최신판 (ver. 2503)	위클리포스트
데스크톱 PC에도 블루투스 잘~ 붙습니다~ 신세계가 열려요!~ (6)	다나와
사진수련중 주화입마에 빠져 폐인이 되지 않는 방법 (1) 동영상 있음	Hakbong Kwon
죽음을 초월한 인간, 《미키17》이 던지는 질문 (2)	과학향기
슈퍼레이스, 개막전 D-30 앞두고 준비 박차...인제·영암·용인 3개 서킷 개최	오토헤럴드
다크플래쉬, 2025 아카데미 페스티벌서 대학생들과 성공적 소통	뉴스탭
MSI, 서울시립대에서 대학생과 활발한 소통 나섰다 (2)	뉴스탭
일자리 도둑 vs 생산성 조력자? 유럽 직장인들은 AI를 어떻게 바라볼까 (1)	AI matters
AI로 진화한 사이버 위협 확산…‘보안 사각지대 노린다’ (5)	IT동아
홍콩 여행 가성비 맛집 4 (8)	트래비

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

모션 캡처가 필요 없다! 걷고, 앉고, 기타 치고...AI가 스스로 배우는 자연스러운 동작 생성 기술

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

모션 캡처가 필요 없다! 걷고, 앉고, 기타 치고...AI가 스스로 배우는 자연스러운 동작 생성 기술

공유하기

공감/비공감