얼굴 하나로 감정, 음주, 졸음까지 읽는다, AI 단일 네트워크의 등장 : 다나와 DPG는 내맘을 디피지

사람의 얼굴에는 생각보다 훨씬 많은 정보가 담겨 있다. 기쁨과 슬픔 같은 감정뿐 아니라 졸음 여부, 심지어 혈중 알코올 농도까지 얼굴 영상만으로 감지할 수 있다는 연구 결과가 나왔다. 에디스 코완 대학교(Edith Cowan University)와 버밍엄 시티 대학교(Birmingham City University) 공동 연구팀이 발표한 논문은 하나의 AI 모델로 표정 인식, 운전자 졸음 감지, 음주 상태 추정을 모두 처리하는 통합 네트워크를 제안하며 각 분야에서 최고 수준의 성능을 기록했다.

기존 AI의 한계, 하나의 모델이 하나의 임무만 수행한다

얼굴 분석 분야의 인공지능 연구는 그동안 각각의 임무에 특화된 별도 모델을 만드는 방식으로 발전해 왔다. 표정 인식용 모델, 졸음 감지용 모델, 음주 탐지용 모델이 따로 존재했으며, 각 모델은 특정 데이터셋에서만 잘 작동하도록 설계됐다. 또한 최근에는 카메라 영상에 음성, 텍스트, 웨어러블 센서 데이터를 결합하는 다중 모달(multimodal, 여러 종류의 입력을 함께 사용하는 방식) 접근법이 성능 향상을 위해 활발히 사용됐다. 그러나 이 방식은 구조가 복잡해지고 특정 환경이나 센서에 의존하게 되는 문제가 있었다. 연구팀은 이 한계를 극복하기 위해 카메라 영상만으로 여러 얼굴 분석 임무를 동시에 처리할 수 있는 단일 3D 시공간 네트워크(3D spatio-temporal network)를 설계했다. 시공간 네트워크란 영상의 각 프레임뿐 아니라 프레임이 시간에 따라 변하는 흐름까지 함께 학습하는 구조를 말한다.

두 가지 핵심 모듈이 얼굴의 세부 정보와 전체 맥락을 동시에 포착한다

연구팀이 제안한 네트워크의 핵심은 두 가지 독자 개발 모듈에 있다. 첫 번째는 콘애드브-이엘씨에이(ConAdv-ELCA, Contrastive Adversarial Efficient Local Channel Attention)로, 눈가의 미세한 떨림이나 입 주변의 근육 움직임처럼 얼굴의 국소적인 세부 특징을 추출하고 정리하는 역할을 한다. 이 모듈은 대립적 학습(adversarial training)과 대조적 학습(contrastive learning)을 결합해 모델이 노이즈에 강하고 다양한 상황에 일반화될 수 있도록 설계됐다. 대립적 학습이란 AI가 의도적으로 방해받은 데이터를 학습해 실제 환경의 불확실성에 강해지는 훈련 방식이다. 두 번째는 이지씨에이(EGCA, Efficient Global Channel Attention)로, 얼굴 전체의 장거리 맥락 관계를 효율적으로 포착한다. 이를테면 눈과 입의 움직임이 어떻게 연관되는지, 얼굴 전체의 전반적인 상태가 어떤지를 파악하는 역할이다. 두 모듈의 협력 덕분에 모델은 세부 정보와 전체 맥락을 균형 있게 학습할 수 있었고, 이것이 다양한 임무에서 높은 성능을 내는 핵심 요인이 됐다.

운전자 졸음 감지 95%, 혈중 알코올 농도 추정 90% 이상 정확도 달성

연구팀은 다섯 개의 공개 벤치마크 데이터셋을 활용해 성능을 검증했다. 운전자 졸음 감지에서는 NTHU-DDD 데이터셋 기준 95.04%의 정확도를 기록하며 기존 최고 성능 모델인 아이소에스에스엘-모코(IsoSSL-MoCo)를 약 1.3%포인트 앞섰다. 혈중 알코올 농도 추정에서는 혈중 알코올 농도 0.08g/dL 기준 이진 분류에서 93%의 수신자 조작 특성 곡선 아래 면적(AUROC, 모델의 분류 능력을 0에서 1 사이로 나타내는 지표)을 달성했다. 표정 인식에서는 DFEW, FERV39K, AFEW 세 개 데이터셋 모두에서 기존 단일 모달 방식을 능가했으며, 특히 DFEW에서는 비가중 평균 재현율(UAR) 60.89%, 가중 평균 재현율(WAR) 71.98%로 최고 성능을 기록했다. 모델의 파라미터 수는 약 2,387만 개로, 최대 8,800만 개에 달하는 경쟁 모델들과 비교해 훨씬 가볍고 빠른 처리 속도를 유지했다.

한 번 학습으로 전혀 다른 임무도 해낸다, 일반화 능력의 증명

이 연구에서 특히 주목할 만한 결과는 교차 임무 일반화 실험이다. 연구팀은 표정 인식 데이터셋인 DFEW만으로 학습한 모델을 졸음 감지와 음주 감지 데이터에 그대로 적용했다. 이 두 임무는 학습 과정에서 전혀 노출되지 않은 완전히 새로운 영역이었다. 그럼에도 티-에스엔이(t-SNE, 고차원 데이터를 2차원으로 시각화하는 기법) 분석 결과, 모델이 졸음 상태와 음주 상태를 의미 있는 군집으로 분류해냈다. 이는 모델이 특정 임무의 정답 레이블에 의존하는 것이 아니라, 얼굴에서 공통으로 나타나는 근본적인 패턴을 학습했음을 의미한다. 연구팀은 이 결과가 단일 모델로 다양한 실세계 응용이 가능함을 보여준다고 강조하며, 향후 더 많은 대형 언어 모델과의 비교 연구 및 다양한 도메인으로의 확장을 계획하고 있다고 밝혔다.

FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q. 이 기술은 실생활에서 어떻게 활용될 수 있나요? 이 기술은 운전 중 졸음이나 음주 상태를 실시간으로 감지해 교통사고를 예방하거나, 표정 분석을 통한 정신 건강 모니터링, 인간과 로봇 간 상호작용 개선 등 다양한 분야에 활용될 수 있습니다.

Q. 카메라 영상만으로 혈중 알코올 농도를 알 수 있나요? 이 연구는 얼굴 영상에서 포착되는 미세한 생리적 변화를 분석해 혈중 알코올 농도를 추정합니다. 별도의 센서 없이 일반 카메라만으로 90% 이상의 정확도를 달성했으며, 음주 측정 보조 수단으로 활용 가능성이 높습니다.

Q. 기존 AI와 비교해 무엇이 다른가요? 기존 AI는 하나의 임무만 처리하는 별도 모델이 필요했고, 여러 데이터를 함께 사용하는 복잡한 구조가 많았습니다. 이 연구의 모델은 카메라 영상 하나만으로 표정 인식, 졸음 감지, 음주 상태 추정을 동시에 처리하며, 크기도 훨씬 작아 실제 장치에 적용하기 유리합니다.

기사에 인용된 리포트 원문은 Birmingham City University Open Access Repository에서 확인할 수 있다.

리포트명: Jack of many Faces: A Step Towards Facial Expression and Physiological State Analysis with a Single Network

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

팝의 황제는 ‘펩시’를 마시지 않았다?	마시즘
2주년 레이븐2 “제로 월드로 고착화된 경쟁 구도 흔든다”	게임메카
'꽃이 무서운 사람들' 3명 중 1명 '이 것' 때문에 운전대를 놓쳤다	오토헤럴드
NHN클라우드, AI 풀스택 브랜드 ‘팩토리X’ 공개…인프라부터 에이전트 실행 환경까지 묶었다	케이벤치
이젠 Physical AI 시대로! 올해 COMPUTEX의 주인공은?	다나와
끈적하고 무거운 원유의 경제학, 가벼울수록 더 비싸다 (1)	과학향기
샥즈 오픈형 이어폰 제조 현장 ‘자체 공장 보유로 철저한 품질 관리’	IT동아
[EV 트렌드] '오히려 줄고 있다?' 테슬라 로보택시, 활성 차량 감소세	오토헤럴드
[김흥식 칼럼] 페라리처럼 팔리지도 않을 전기차를 만드는 진짜 이유 (1)	오토헤럴드
[겜ㅊㅊ] 그저 틀어놓기만 하면 돼, 바탕화면 방치게임 5선	게임메카
20년 째 계속되는 희망 고문 "아무도 시작 못하는 자율 주행" 동영상 있음	오토기어
갤럭시S26과 엑시노스 2600, 그리고 삼성 파운드리 동영상 있음	민티저
상반기 수도권 최대 게임쇼. 플레이엑스포 2026 참관기	기글하드웨어
"또 연기된 비감독형 FSD" 구독으로만 판매하는 진짜 이유 동영상 있음	오토기어
세계인이 몰려드는 빠통에 숨은 로컬 공간 4	트래비
[뉴스줌인] 외산 GPU와 국산 NPU, '투트랙'으로 가는 AI 인프라 지원 정책	IT동아
[위클리AI] 구글, 제미나이 옴니 플래시 공개 "말 한마디로 영상 편집" 외	IT동아
독일차는 기본기 때문에 탄다더니 국산차 기본기는 중요하지 않다? 동영상 있음	오토기어
세상이 미쳤으니까 나도 극단적으로 간다! 시대를 무시한 최강 게이밍 PC 동영상 있음	집마 홀릭TV
칸의 돌풍, 영화 호프 경찰차 '스텔라'는 80년대 '부와 명예'의 상징 (1)	오토헤럴드
[모빌리티 인사이트] 공급망 재편 2라운드 돌입, 신규 변수는 '관세' (1)	오토헤럴드
[정석희의 기후 에너지 인사이트] 11. 200년 전 물리학이 겨울 난방에 던지는 질문	IT동아
호캉스 가고 단캉스가 온다, 라구나 푸껫 (1)	트래비
[숨신소] 확성기 독재자에 반항하는 퍼즐게임 '포노폴리스' (1)	게임메카
석 달째 횡보하는 PC시장 메모리 가격 하반기 메모리 모듈 가격의 향방은? 동영상 있음	보드나라
뻘짓연구소라는 테크 유튜버에 대해 말할 것이 있습니다.... 동영상 있음	THE EDIT
[겜덕연구소] 게임 표절과 복사.. 저작권 그게 뭐죠? 먹는 건가요? (1)	게임동아
SUV에 밀려 "죽었다" 사망 선고 받았던 '세단' 암흑기 끝내고 부활 조짐	오토헤럴드
[EV 트렌드] 기아, 유럽서 피칸토 단종 수순 '엔트리 EV 전략 본격화' (1)	오토헤럴드
日서 강력한 경쟁자 만난 '현대차 인스터' 심상치 않은 혼다 슈퍼원 돌풍 (1)	오토헤럴드
'판매 부진 털어낼 카드' 마세라티, 파리서 미래 담은 콘셉트카 예고	오토헤럴드
“F1 새 황제 키미 안토넬리" 캐나다 그랑프리 우승으로 4연승 질주	오토헤럴드
[인디言] 도트 '잇 테이크 투'를 꿈꾸는 팀 따코야끼	게임메카
[2026 플레이엑스포] PCIe 5.0 SSD 시대 선도하는 '키오시아'	미디어픽
[플레이엑스포 2026] 게임으로 그래픽 기술을 설명하다… PALIT과 이엠텍	위클리포스트
[2026 플레이엑스포] 게이밍 하드웨어의 새로운 가능성 제시한 '이엠텍아이엔씨'	미디어픽
[2026 플레이엑스포] 포유컴퓨터, AMD와 손잡고 붉은사막 체험존 선보여	미디어픽
[2026 플레이엑스포] 게이머 위한 혁신 제품 선보인 '에센코어 클레브'	미디어픽
[2026 플레이엑스포] 게임 산업과 소비자를 잇는 다리 '다나와 테크아레나'	미디어픽
[일러스타페스11] 더 매력적으로 진화하는 서브컬처 굿즈들	게임동아
[취재] 플레이엑스포와 일러스타페스11, 행사를 빛내준 코스플레이어들	게임동아
[취재] 이게 진짜 게임이지! '아케이드 게임'의 가능성을 쏜 플레이엑스포	게임동아
[일러스타페스11] 니벨아레나로 몰린 인파들.. "니케와 스텔라블레이드 콜라보는 못참지"	게임동아
[취재] 피크민과 한강 산책 즐기세요! 나이언틱 ‘피크민 블룸 저니 2026 서울’ 행사 개최	게임동아
[체험기] '신'이 되어 내 마음대로? 넷마블, '솔: 인챈트'	게임동아
[취재] 또 다른 국산 소울라이크 기대작! 노바플레어 ‘프로젝트 래빗’ 플레이엑스포에서 화제	게임동아
[취재] "잠실을 수놓은 메이플의 향연~" '메이플 어택! 위드 롯데' 가보니	게임동아
[르포] "좁은 집, 넓게 사는 법" 미니창고 다락, AIoT로 공간 경제 바꾼다	IT동아
“피지컬 AI 구현 방향을 고민하다” 어드밴텍 엣지 AI 솔루션 세미나	IT동아
‘도로 위 언어’ 노면 표시 의미 살펴보니 (1)	IT동아
카카오톡 교환권, 이제 가족·지인과 함께 쓴다···패밀리계정 직접 써보니	IT동아
플레이엑스포2026에서 만나본 GARAGE ARTS (게라지아츠)의 Oh! Robot: Legendary Mechanic - "애즈락 x 마이크로닉스"	브레인박스
게이머들에게 사랑받고 싶은 플레이엑스포 2026 클레브 (KLEVV) 부스	브레인박스
노트북 닫으세요, 구글 AI 에이전트가 24시간 일합니다 구글 I/0 2026 동영상 있음	AI matters
ROG 20년, ASUS가 PlayX4에 꺼내 든 ‘하이엔드 게이밍의 정수’	다나와
“그래픽카드는 브랜드 보고 산다”… 이엠텍, PlayX4서 팔릿의 이유를 보여주다 (1)	다나와
엑스지미, 플레이엑스포서 ‘TV보다 큰 축구장’ 펼쳤다… FC26 대화면 게이밍 체험 눈길	다나와
“독거미 키보드부터 잠자리 마우스까지”…펀키스, 플레이엑스포서 게이밍 기어 총공세	다나와
‘화면 달린 쿨러’가 시선 잡았다…얼티메이크, 플레이엑스포서 PCCOOLER 빌드 전략 공개 (1)	다나와
게임 보러 왔다가 PC까지 꽂혔다… HP, 플레이엑스포서 게이밍·AI PC 존재감 과시	다나와
“게임하러 왔다가 SSD까지 바꾼다”…키오시아가 플레이엑스포서 꺼낸 ‘낸드 원조’의 자신감	다나와
일론 머스크도 다 못 읽었을 스페이스X 500P 상장 신청서, 10분 만에 끝내기 \| 노트북LM 활용 (1) 동영상 있음	AI matters
게이머들와 친해지기, 마이크로닉스 2026년 라인업 부스 - 플레이엑스포 2026	브레인박스
[정보/루머] 효율 챙기며 가성비 시장 공략 나선 인텔과 AMD, 지포스 놓고 애매한 입장 취하는 엔비디아 등 (1)	다나와
[취재] 포가튼사가, 컬드셉트. 플레이엑스포에서 추억의 게임으로 화제된 대원미디어	게임동아
"현대는 절대 테슬라 못 따라간다?" SDV가 정확히 뭐길래? 동영상 있음	오토기어
대원미디어, 세상에 없던 '버그 없는 포가튼사가' 만든다	게임메카
플레이엑스포에서 만난 SANDISK, “옵티머스로 SSD 시장 다시 리드한다”	다나와
플레이엑스포 한복판에서 KLEVV의 체감 성능 승부! (1)	다나와
플레이엑스포에서 만나볼 수 있었던 엔비디아 지포스 RTX 시리즈 - 이엠텍 부스	브레인박스
[김훈기 칼럼] 'SDV 다음은 AIDV' 완성차 업계, 수익 모델 찾아 총성 없는 전쟁 (1)	오토헤럴드
[EV 트렌드] "유가 폭등이 당겼다" 전기차, '에너지 안보 자산'으로 급부상 (1)	오토헤럴드
[순정남] 경영진이 정신 나간 게임 속 '막장' 기업 TOP 5	게임메카
[취재] 미래를 맛보는 플레이엑스포 ‘XR 센트럴 스테이션’, 애플 비전프로·햅틱 슈트 총출동!	게임동아
벤츠ㆍBMW 산다던 3명 중 1명 기아로... '결정 직전 기묘한 변심'	오토헤럴드
[EV 트렌드] 현대차·기아, 엔트리 EV 공동 개발 '보급형 전기차 확대' (1)	오토헤럴드
차값보다 무서운 기름값 '전기차 vs 가솔린' 격차 3년 새 41.7% 급등	오토헤럴드
김영준 파블로항공 의장·한국항공대 혁신융합대학 사업단 특강 ‘K-드론의 미래’ 제시	IT동아
제미나이 3.5 플래시·자체 반도체로 무장한 구글, AI 주도권 탈환 나선다 (1)	IT동아
[월간자동차] 26년 4월, 테슬라 ‘모델 Y’ 1만대 이상 판매 (1)	IT동아
"손목 위 코치" 서울시청 철인3종팀의 GPS 활용법	IT동아
샌디스크, 독립 경영 출범 이후 첫 신제품 기자간담회 개최... 옵티머스 SSD·FIFA 월드컵 에디션 공개	케이벤치
결국 무너진 애플... 맥미니 기본형 삭제, 맥북 네오까지 위기인 이유 동영상 있음	주연 ZUYONI
밀라노에서 베네치아 기차로 가는 방법, 이딸로&트렌이탈리아 가이드	트래비
한국인들이 아직 잘 모르는 홍콩 사진 스폿 5	트래비
소비자 중심의 철학과 신뢰를 이어간다, 샌디스크 신제품 출시 기자간담회	블루프레임
연인과 함께 가면 좋은 이탈리아 로마 맛집 3	트래비
챗GPT 1위는 그대로인데 클로드 사용자가 1년 새 12배 폭증한 이유	AI matters
[겜ㅊㅊ] 고생 끝에 낙이 온다, 소울라이크 신작 5선	게임메카
일론 머스크 말 믿고 호수에 뛰어든 사이버트럭 운전자 '비극적 결말' (1)	오토헤럴드
[EV 트렌드] 볼보, 미국서 EX30 돌연 철수 '대체할 보급형 전기차 준비'	오토헤럴드
[모빌리티 인사이트] BMW도 현대차도 AI 넣는데 '진짜 돈 되는 건 아직'	오토헤럴드
세계에서 ‘가장 비싼 와인’을 위조한 남자	마시즘
메모리 폭등 시대 더 비싼 삼성 시금치 메모리, 돈 더 주면서 계속 써야할까? 이제는 놓아줄 때가 되었다 동영상 있음	보드나라
IBM, 양자 중심 슈퍼컴퓨팅 시대 예고…“올해 양자 우위 입증할 것”	IT동아
"AI 많이 쓰면 일잘러?" 빅테크 흔드는 '토큰맥싱' 열풍	IT동아
[위클리AI] "성능 경쟁 끝났다" 앤트로픽부터 메타까지 글로벌 빅테크 신뢰 전쟁 돌입	IT동아
유아이패스 "업무 자동화용 에이전틱 AI, 이제는 '진짜 쓸모' 따질 때"	IT동아
[자동차와 法] 소프트웨어 중심 자동차 시대…바퀴 달린 컴퓨터 맞이하는 낡은 법의 한계	IT동아
'치솟는 원가에 무너진 수익 방어선' 글로벌 완성차 가격 딜레마	오토헤럴드

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

얼굴 하나로 감정, 음주, 졸음까지 읽는다, AI 단일 네트워크의 등장

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

얼굴 하나로 감정, 음주, 졸음까지 읽는다, AI 단일 네트워크의 등장

공유하기

공감/비공감