세계보건기구(WHO)에 따르면 전 세계적으로 약 4억 3천만 명(전체 인구의 약 5%)이 청각장애를 겪고 있으며, 2050년까지 이 수치는 7억 명으로 증가할 것으로 예측된다. 영국의 경우에도 약 1,100만 명이 청각 장애를 겪고 있으며, 특히 노인층에서 심각한 문제로 대두되고 있다. 이러한 상황에서 2050년까지는 기존의 음성 또는 소리 향상의 제약에서 벗어난 차세대 보청기의 변화가 필요한 시점이다.
글래스고 대학교 연구진이 개발한 RFID 기반 스마트 마스크는 기존 립리딩 기술의 한계를 획기적으로 극복했다. 특히 코로나19 시대에 마스크 착용이 일상화되면서 기존의 카메라나 웨어러블 기기 기반 기술이 가진 주변 조명 문제, 프라이버시 우려, 착용 불편 등의 문제를 해결했다.
이 기술은 일반 마스크에 수동형 UHF RFID 태그를 부착하여 입술 움직임을 감지하는 방식으로, 연구팀은 다양한 종류의 마스크(1겹, 2겹, 3겹)와 색상에서도 안정적인 성능을 확인했다. 특히 0.5미터 거리에서 데이터를 수집할 수 있어 실용성을 갖췄다.
연구팀은 16-50세 연령대의 남녀 참가자 4명(남성 2명, 여성 2명)을 대상으로 총 2,800개의 데이터 샘플을 수집했다. 데이터는 세 가지 카테고리로 구분되었다:
- 모음: A, E, I, O, U
- 자음: F, G, M, S
- 단어: Fish, Goat, Meal, Moon, Snake
각 클래스당 50개의 샘플을 수집했으며, 데이터는 훈련용(80%)과 테스트용(20%)으로 분리되어 AI 모델 학습에 활용되었다.
다양한 기계학습 모델을 적용한 결과, 각 카테고리별로 놀라운 성능을 보였다:
- 모음 인식: 80.07%
- 자음 인식: 89.05%
- 단어 인식: 93.0%
- 전체 14개 클래스 통합 정확도: 80%
연구팀은 랜덤 포레스트(Random Forest), k-최근접 이웃(k-NN), 서포트 벡터 머신(SVM RBF) 등 다양한 기계학습 알고리즘을 적용했으며, 각 모델의 특성에 맞는 최적의 하이퍼파라미터를 설정하여 성능을 극대화했다.
연구에 사용된 RFID 태그는 유연하고 낮은 프로파일의 선형 편파 섬유 세탁 태그로, 다양한 부착 방법을 제공한다. 태그의 크기는 58×15×1.5mm이며, EPC Gen2 규격을 준수하고 Impinj Monza R6P 집적회로를 사용했다. 건조 상태에서는 최대 6.5m, 습윤 상태에서도 5m까지의 인식 거리를 보여주었다.
이 연구는 RFID 기반의 스마트 마스크를 통해 프라이버시를 보호하면서도 접촉이 필요 없는 립리딩 인식 프레임워크를 제시했다. 연구진은 일상적인 마스크에 RFID 태그를 내장하여 효과적인 립리딩 인식을 구현했으며, 다양한 기계학습 모델을 통해 이를 처리하는데 성공했다.
연구팀은 향후 실시간으로 작동하고 보다 직관적인 립리딩 시스템을 개발하는 것을 목표로 하고 있다. 특히 더 많은 단어와 문장을 인식할 수 있도록 시스템을 발전시키고, 청각장애인과 시각장애인을 포함한 다양한 최종 사용자들의 요구에 맞춰 시스템을 개인화하는 방향으로 연구를 확장할 계획이다.
이 기술의 실제 구현을 위해서는 몇 가지 중요한 과제들이 남아있다. 특히 RFID 인프라 구축에 필요한 비용과 다양한 사용자의 요구를 수용할 수 있는 확장성 확보가 주요 과제로 꼽힌다. 또한 기존 보청기와의 통합 과정에서 발생할 수 있는 데이터 전송과 동기화 문제를 해결해야 하며, 시스템의 신뢰성과 효과성을 보장하기 위한 포괄적인 평가와 테스트도 필요하다.
이러한 과제들이 해결된다면, 이 기술은 청각장애인들의 의사소통을 획기적으로 개선할 수 있는 잠재력을 가지고 있다. 특히 마스크 착용이 일상화된 현대 사회에서, 이러한 기술의 발전은 청각장애인들의 삶의 질 향상에 크게 기여할 것으로 기대된다.
기사에 인용된 논문의 원문은 링크에서 확인할 수 있다.
기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.
AI Matters 뉴스레터 구독하기