비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

AI가 정신건강 진단을 돕는다...정확도 100% 달성한 하이브리드 진단시스템 개발

2025.01.23. 16:47:59
조회 수
260
15
댓글 수
4

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Large Language Models for Interpretable Mental Health Diagnosis

1000페이지 진단 매뉴얼의 복잡성 해결을 위한 혁신적 접근

남부 캘리포니아 대학교(USC) 연구진이 개발한 임상의사결정지원시스템(CDSS)이 대규모 언어모델(LLM)과 제약논리프로그래밍(CLP)을 결합해 정신건강 진단의 정확도를 100%까지 높였다는 연구 결과를 발표했다. 해당 논문에 따르면, DSM-5-TR과 ICD-11 CDDR과 같은 진단 매뉴얼은 1,000페이지가 넘는 방대한 분량으로, 과도한 업무에 시달리는 정신건강 전문가들의 부담을 가중시키고 진단 오류의 위험을 높이고 있었다.

데이터로그 기반의 3단계 정밀 진단 프로세스 구현

연구진이 개발한 시스템은 데이터로그(Datalog) 프로그래밍 언어를 활용해 3단계로 작동한다. 첫째, ICD-11 CDDR의 자연어 텍스트가 LLM에 입력되면 진단 규칙을 담은 후보 논리 프로그램이 생성된다. 둘째, 도메인 전문가가 이 프로그램을 검토하여 매뉴얼의 기준에 정확히 부합하도록 수정한다. 예를 들어, 혼재성 삽화(Mixed Episode)의 정의를 조정하고 현재 기분 삽화의 진단 로직을 개선하는 등의 작업이 이루어진다. 마지막으로, Soufflé라는 최신 데이터로그 엔진에서 완성된 논리 프로그램을 실행하여 진단 결과를 도출한다.



4가지 기분장애에 대한 30명의 환자 진단 결과 분석

연구팀은 4가지 주요 기분장애(양극성 장애 I형, 양극성 장애 II형, 단일 삽화 우울 장애, 재발성 우울 장애)에 대해 시스템을 평가했다. 30명의 환자 데이터 중 양극성 장애 I형 9명, 양극성 장애 II형 8명, 단일 삽화 우울 장애 5명, 재발성 우울 장애 4명을 정확하게 진단했으며, 나머지 4명은 진단 기준에 해당하지 않음을 올바르게 판별했다.

최신 LLM 3종의 성능 비교 분석 결과

2024년 5월 출시된 GPT-4O, GEMINI-1.5-FLASH, 2024년 9월 출시된 LLAMA-3.2를 대상으로 세 가지 접근법을 비교했다. LLM 단독 사용 시에는 GPT가 30명 중 22명(73.3%), Gemini와 Llama가 각각 19명(63.3%)을 정확하게 진단했다. LLM이 생성한 논리 프로그램만을 사용했을 때는 GPT 7/10, Gemini 4/10(부분 정확 포함), Llama 3/10의 정확도를 보였다. 특히 Gemini는 양극성 장애 I형과 II형을 동시에 진단하는 등의 오류를 보였다.

154줄의 코드로 구현된 정밀 진단 시스템

연구진은 프로그램 개선 과정에서 초기 107줄의 코드를 154줄로 확장했다. 구체적으로 47줄을 추가하고 6줄을 수정하여 순환 종속성과 임상적 비일관성을 해결했으며, 추가로 10줄을 추가하고 4줄을 제거하여 현재 기분 삽화 진단 로직을 개선했다. 이를 통해 GPT가 생성한 초기 코드의 한계를 극복하고 완벽한 진단 정확도를 달성했다.

환자 데이터 보안 강화와 진단 과정의 투명성 확보

이 시스템은 환자의 민감한 정보를 직접 LLM에 입력하지 않고 논리 프로그램을 통해 처리한다. 또한 모든 진단 과정이 명시적인 규칙으로 표현되어 있어 결과의 해석이 용이하다. 특히 진단 기준을 데이터로그 규칙으로 변환하는 과정에서 전문가의 검토가 가능하여, LLM의 환각 현상이나 일관성 부족 같은 문제를 효과적으로 방지할 수 있다.

윤리적 고려사항과 실제 임상 적용을 위한 제언

연구진은 이 시스템이 전문가의 진단을 완전히 대체하는 것이 아닌 보조 도구로 사용되어야 함을 강조했다. 또한 도메인별 LLM 미세조정, 실제 임상 데이터셋 평가, 더 세밀한 진단 기준 적용 등을 향후 연구 방향으로 제시했다. 이 연구는 AI 기술과 전문가 지식의 균형 잡힌 결합을 통해 정신건강 진단의 정확성과 신뢰성을 크게 향상시킬 수 있음을 입증했다.

해당 기사에서 인용한 논문은 링크에서 확인할 수 있다.

이미지출처: 이디오그램 생성

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
서린씨앤아이 '에센코어 클레브 어베인 V RGB' 완제 PC 구매 시 사은품 증정 다나와
버니 샌더스 "AI 채팅이 지적 향상에 무슨 의미가 있나" 동영상 있음 AI matters
2011년생 아마추어 안윤주, 280야드 '펑펑'…롯데오픈 첫날 12위 연합뉴스
마다솜, KLPGA 투어 롯데오픈 첫날 단독 선두…노승희 등 2위 연합뉴스
최혜진 "최근 LPGA 투어 좋은 성적 의식하지 않고 경기에 집중" 연합뉴스
스텔란티스, 고성능 브랜드 SRT 전격 부활… 다시 뜨거워진 머슬카 전쟁 오토헤럴드
'대기업도 녹록지 않은 전기차 도전' 소니와 혼다 4900억원대 손실 (1) 오토헤럴드
“식당·영화·신조어 핵심 정보만 요약” 네이버 AI 브리핑, 사용자 편의성 높일까 IT동아
‘AI 자율 네트워크’ 강조하는 노키아, 韓 6G 인프라 투자 기회 엿본다 IT동아
대규모 전투 '서버대전' 추가, 위메이드 레전드 오브 이미르 시즌 2 업데이트 실시 게임동아
"게임이 사행 불건전 산업?" 경기도일자리재단 게임 공공지원 제외 논란 (1) 게임동아
엠게임 ‘아레스 온라인’, 21주년 맞이 대규모 업데이트 예고 게임동아
플레이위드코리아, 씰온라인 여름맞이 상위 콘텐츠 대규모 업데이트 게임동아
스마일게이트의 신작 ‘카오스 제로 나이트메어’ 제작 발표 영상 공개한다 게임동아
컴투스 방치형 RPG ‘갓앤데몬’, 풍성한 '여름 파티' 이벤트 진행 게임동아
김효주 "후원사 대회 우승 기대…다음 주 메이저도 죽기 살기로" 연합뉴스
'E-클래스가 밋밋해? 매운맛 제대로' AMG E 53 하이브리드 4메틱 플러스 오토헤럴드
'조금, 아니 아주 특별한 S 클래스' 메르세데스-AMG S 63 E 퍼포먼스 오토헤럴드
볼만하네... 한국에서 가장 큰 제네시스 전용관 오토헤럴드
서울! 이 아름다운 도시를 가장 편안하게 즐기는 '타이거 버스'... Tiger Bus 오토헤럴드
이 시간 HOT 댓글!
1/4