비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

AI로 치매 조기 발견할까? 혈액검사 없이 5분간 대화하고 치매 진단… 정확도 85% 돌파

2025.08.25. 18:53:55
조회 수
198
12

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

미국 컬럼비아 대학교 연구팀이 인공지능(AI)으로 사람의 말하는 방식을 분석해서 알츠하이머 치매를 조기에 발견하는 기술을 개발했다. 이 기술은 환자가 그림을 보고 설명하는 말을 컴퓨터가 듣고 분석해서 치매 위험을 판단한다. 현재 미국에는 알츠하이머 환자가 약 500만 명에 달하지만, 그중 절반 이상이 진단을 받지 못하고 있다. 2050년까지는 환자 수가 1,320만 명까지 늘어날 것으로 예상된다. 연구팀은 53세 이상 237명(여성 60% 이상)의 음성 데이터를 사용해 연구를 진행했다.

연구팀은 두 가지 방법을 결합했다. 하나는 컴퓨터가 스스로 언어 패턴을 학습하는 '트랜스포머'라는 AI 기술이고, 다른 하나는 전문가들이 직접 만든 110가지 언어 특징들이다. 10개의 서로 다른 트랜스포머 모델을 평가한 결과, BERT 모델이 마지막 층만 미세 조정했을 때 좋은 성능을 보였다.

이 두 방법을 합쳐서 만든 융합 시스템이 테스트에서 83.3%의 정확도를 기록했다. 전문가가 만든 언어 특징만 사용했을 때는 검증 세트에서는 81.2%였지만 테스트 세트에서는 66.2%로 떨어졌다. 하지만 AI 기술과 결합한 융합 모델은 테스트 세트에서도 안정적인 성능을 보였다. 연구 결과에 따르면 일반 목적으로 훈련된 모델들이 의료 전문 도메인 모델들보다 더 나은 결과를 보였다.

실제보다 더 실제 같은 AI 대화, 치매 진단 성능 2배 향상

연구에 사용할 환자 대화 데이터가 부족한 문제를 해결하기 위해, 연구팀은 5가지 대형 언어 모델을 사용해 합성 대화 데이터를 생성했다. 라마(LLaMA) 3.1 8B, 메드알파카(MedAlpaca) 7B, 미니스트랄(Ministral) 8B, 라마 3.3 70B, GPT-4o를 평가했다. 메드알파카 7B가 만든 가짜 대화로 컴퓨터를 다시 가르쳤더니, 치매를 찾아내는 능력이 78%에서 81%로 올라갔다. 연구팀은 이 가짜 대화가 얼마나 진짜 같은지 여러 방법으로 확인했다. 문장의 의미가 비슷한지, 사용하는 단어들이 비슷한지 체크하고, 데이터들이 어떻게 분포되어 있는지도 그림으로 그려서 살펴봤다.

원래 환자 대화 데이터에 메드알파카가 만든 가짜 대화를 2배만큼 더해서 컴퓨터를 훈련시켰더니, 최종 테스트에서 85.7%라는 최고 성능이 나왔다. 하지만 가짜 대화를 너무 많이 추가하면 오히려 성능이 떨어지는 것을 확인했다. 흥미롭게도 라마-70B라는 다른 AI는 사용하는 단어들이 진짜 환자 대화와 가장 비슷했지만, 실제로는 치매 진단 성능을 높이는 데 도움이 되지 않았다. 이는 단순히 비슷한 단어를 쓰는 것보다, 치매 환자 특유의 말하는 패턴을 제대로 따라 하는 것이 더 중요하다는 뜻이다.

목소리+글자 보는 AI보다 글자만 보는 AI가 더 정확하다

연구팀은 텍스트만 사용하는 단일모달 모델과 음성과 텍스트를 함께 사용하는 멀티모달 모델의 성능을 비교했다. 제로샷 설정과 미세 조정 설정 모두에서 평가했다. 미세 조정이 모든 텍스트 기반 모델의 성능을 향상시켰다. 메드알파카 7B는 47.3%에서 78.5%로 가장 큰 개선을 보였다. 라마 3.1 8B는 69.33%에서 81.18%로, 라마 3.3 70B는 70.19%에서 83.33%로, GPT-4o는 72.58%에서 78.81%로 향상됐다.

반면 멀티모달 모델들은 제한적인 성능을 보였다. GPT-4o 멀티모달 버전은 제로샷에서 70.19%를 기록했고, Qwen 2.5-Omni는 미세 조정 후 66.95%에서 66.03%로 오히려 소폭 감소했다. Phi-4는 59.40%에서 55.73%로 감소했다. 이러한 결과는 현재의 멀티모달 모델들이 자연스러운 음성에서 인지-언어적 마커를 감지하는 데 최적화되지 않았음을 시사한다.

FDA 승인 혈액검사와 상호 보완적 역할 기대

2025년 5월 FDA가 후지레비오의 Lumipulse G pTau217/β-amyloid 1-42 혈액검사를 알츠하이머병 진단용으로 승인했다. 이 생물학적 바이오마커 검사는 뇌의 병리학적 변화를 감지할 수 있지만, 일상적 의사소통에서 나타나는 인지 기능 저하는 반영하지 못한다. 언어 변화는 종종 일찍 나타나며 생물학적 검사로는 감지할 수 없는 실제 기능적 저하를 신호할 수 있다. 단어 찾기 어려움, 구문 해체, 유창성 감소 같은 초기 언어 장애는 그림 묘사 과제를 통해 감지 가능할 수 있다.

연구팀은 생물학적 데이터와 음성 기반 분석을 결합하면 더 완전한 임상 정보를 제공할 수 있다고 설명했다. 이는 더 이른 시기에 더 정보에 기반한 의뢰, 영상 검사, 개입 결정을 지원할 수 있다. 하지만 음성 처리 알고리즘의 의료 현장 통합을 위해서는 임상 워크플로우와의 호환성, 임상의 태도, 운영상 과제 등을 고려한 포괄적 연구가 필요하다고 강조했다.

FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q: 이 기술은 어떤 방식으로 치매를 찾아내나요?

A: 연구에서는 '쿠키 도난 테스트'라는 그림 묘사 과제를 사용했습니다. 참가자들이 그림을 보고 설명하는 음성을 녹음해서 AI가 분석합니다. 치매 환자는 단어 반복, 비유창성, 구문 오류 등의 언어적 특징을 보이는데, AI가 이런 패턴을 감지합니다.

Q: 일반 목적 AI가 의료 전문 AI보다 성능이 좋은 이유는 무엇인가요?

A: 연구 결과에 따르면 위키피디아나 일반 텍스트로 사전 훈련된 모델들이 의료 및 임상 텍스트로 훈련된 도메인별 모델들보다 더 나은 성능을 보였습니다. 연구팀은 일반 도메인 모델이 구조화된 임상 텍스트보다 대화적 비유창성을 더 잘 포착할 수 있기 때문으로 분석했습니다.

Q: 이 기술을 병원에서 실제로 사용할 수 있나요?

A: 기술적 가능성은 있지만, 실제 임상 적용을 위해서는 더 많은 연구가 필요합니다. 현재 연구는 영어 텍스트와 구조화된 과제로 제한되어 있고, 다양하고 자연스러운 음성 환경으로의 일반화 가능성에 대한 추가 검증이 필요합니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문 명: LLMCARE: Alzheimer's Detection via Transformer Models Enhanced by LLM-Generated Synthetic Data

이미지 출처: 챗GPT 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.





AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
BYD, '휘발유와 에탄올' 세계 최초 바이오 연료 슈퍼 하이브리드 공개 오토헤럴드
포르쉐 전기차 돌풍… 마칸 18% 급등, 한국 전동화 비중 59.4% ‘역대 최고’ 오토헤럴드
"자칫하면 수천만 원" 보증기간 끝난 테슬라 중고차 가격 큰 폭 하락 오토헤럴드
현대차ㆍ테이트 미술관, '현대 커미션: 마렛 안네 사라: Goavve-Geabbil' 개막 오토헤럴드
지엠, 수소연료전지 개발 중단 선언 "전기차 등 명확한 기술에 집중" 오토헤럴드
확률 공개 포함, 해외 게임사 국내대리인제도 23일 시행 게임메카
대학생이라면 누구나! 캐논코리아, ‘2025 미래작가상’ 참가자 모집 시작 (1) 뉴스탭
AMD, 파트너와 함께 성장한다… 글로벌 채널 프로그램 ‘APN’ 공개 (1) 뉴스탭
세레니끄, 2007년부터 ‘데이터 기반 맞춤 피부 관리’ 선도… 과학적 진단으로 고객 신뢰 구축 뉴스탭
‘하이트제로 0.00’이 연 무알코올 맥주의 시대… MZ세대 건강 트렌드 타고 시장 ‘폭발 성장’ (1) 뉴스탭
OpenAI–브로드컴, 10GW급 맞춤형 AI 가속기 동맹…설계부터 네트워킹까지 ‘풀스택’ 내재화 (1) 다나와
EU, ‘Apply AI’로 11억 달러 투입…현장 도입 가속해 기술 주권 겨냥 다나와
글로벌 스마트폰 출하량 2.6%↑…프리미엄·AI폰 수요가 반등 견인 다나와
Gitex 2025, UAE ‘AI 순찰차’ 첫 공개…비자·체류 위반 실시간 탐지 시연 다나와
Deloitte, ‘클로드(Claude)’ 전사 확장…오류 보고서 환불 사과와 함께 규제 산업 공략 속도 다나와
기아, 'PV5' 기부 사회공헌 사업 'Kia Move & Connect' 시작 글로벌오토뉴스
미국 NHTSA, 테슬라 FSD 시스템 안전성 조사 착수…총 288만 대 대상 글로벌오토뉴스
포르쉐, 2025년 3분기 전동화 비중 35% 돌파…전세계 21만대 인도 글로벌오토뉴스
기아 유럽, EV 배터리 투명성 혁신 시동…셀 수준 배터리 여권 최초 시험 글로벌오토뉴스
중국 전기차, 출혈 경쟁 피해 해외로 눈 돌린다…BYD·샤오펑 등 수출 전략 가속 글로벌오토뉴스
이 시간 HOT 댓글!
1/4