"AI 의사가 인간 의사보다 4배 정확"... MS 의료 AI, 80% 진단 성공률 달성 : 다나와 DPG는 내맘을 디피지

Sequential Diagnosis with Language Models

마이크로소프트가 만든 인공지능 의사가 실제 의사보다 훨씬 더 정확하게 병을 찾아냈다. 이 AI 시스템의 이름은 'MAI-DxO'인데, 오픈AI의 최신 모델과 함께 사용했을 때 80%의 정확도로 병을 진단했다. 반면 실제 의사들은 평균 20%만 맞혔다. 즉, AI가 4배나 더 정확한 것이다.

마이크로소프트 AI 연구팀은 의학계에서 가장 권위 있는 잡지인 뉴잉글랜드 의학저널에 실린 어려운 병 사례 304개를 가지고 실험했다. 이 사례들은 의대생들이 공부할 때 사용하는 매우 복잡하고 어려운 케이스들이다. AI와 의사 모두 같은 조건에서 이 문제들을 풀어야 했다.

실제 병원처럼 단계별로 정보를 얻어가며 진단하는 새로운 방식

지금까지 AI의 의료 능력을 테스트할 때는 모든 정보를 한 번에 주고 객관식 문제를 풀게 했다. 하지만 실제 병원에서는 의사가 환자를 만나 증상을 듣고, 필요한 검사를 하나씩 선택해서 진단을 내린다. 연구진은 이런 실제 상황을 똑같이 만들어냈다.

AI와 의사 모두 처음에는 "29세 여성이 목이 아프고 목 주위가 부어올라 병원에 왔다"같은 간단한 정보만 받는다. 그다음에는 "언제부터 아팠나요?" "열은 없었나요?" 같은 질문을 하거나 "CT 촬영을 해주세요" 같은 검사를 요청해야 한다. '게이트키퍼'라는 AI가 환자 역할을 해서 질문에 답하고 검사 결과를 알려준다. 검사할 때마다 실제 병원처럼 돈이 들어가고, 마지막에 진단이 맞았는지와 총 비용이 얼마나 들었는지를 함께 평가한다.

5명의 AI 의사가 팀을 이뤄 서로 다른 역할로 협력 진단

MAI-DxO의 특별한 점은 마치 5명의 의사가 팀을 이뤄 진료하는 것처럼 만들어졌다는 것이다. 각각 다른 역할을 맡은 AI 의사들이 있다. 첫 번째는 '가설 의사'로 "이 환자는 A병일 확률이 60%, B병일 확률이 30%" 이런 식으로 가능성을 계산한다. 두 번째는 '검사 선택 의사'로 진단에 가장 도움이 되는 검사 3개를 고른다. 세 번째는 '도전 의사'로 "잠깐, 다른 가능성은 없을까?"라며 반대 의견을 제시한다. 네 번째는 '비용 관리 의사'로 "이 검사 말고 더 싼 방법은 없을까?"라고 묻는다. 다섯 번째는 '체크 의사'로 실수가 없는지 최종 점검한다. 이런 방식으로 만든 AI 시스템은 GPT, 클로드, 제미나이 등 어떤 AI 모델을 사용해도 평균 11%씩 정확도가 올라갔다.

MAI-DxO의 놀라운 점은 어떤 AI 모델을 사용해도 성능이 향상된다는 것이다. 연구진은 GPT-4o, 클로드 4 소넷, 제미나이 2.5 프로, 그록-3, 라마 4, 딥시크-R1 등 총 15개의 다른 AI 모델로 실험했다. 결과는 놀라웠다. 상대적으로 성능이 낮은 AI 모델일수록 MAI-DxO를 적용했을 때 더 큰 향상을 보였다. 예를 들어 클로드 4 소넷은 63.2%에서 72.4%로 9.2%포인트 올랐고, 제미나이 2.5 플래시는 56.2%에서 68.4%로 12.2%포인트나 향상됐다. 이는 MAI-DxO가 각 AI 모델의 약점을 보완해 주기 때문이다. 성능이 낮은 AI는 체계적인 진단 과정에서 도움을 받고, 성능이 높은 AI는 비용 효율성이 개선된다는 것이다.

정확도 85.5%까지 올리면서 의료비는 70% 절약

MAI-DxO는 진단을 더 정확하게 할 뿐만 아니라 돈도 훨씬 적게 썼다. 일반 AI가 78.6%의 정확도로 환자 한 명당 7,850달러를 쓴 반면, MAI-DxO는 79.9%의 정확도로 2,397달러만 썼다. 가장 정확한 모드로 설정하면 85.5%의 정확도까지 올릴 수 있다. 이때는 7,184달러가 들지만 여전히 일반 AI보다는 저렴하다.

실험에 참가한 실제 의사들은 미국과 영국에서 일하는 21명이었다. 이들은 평균 12년의 경험을 가진 가정의학과나 내과 의사들이었다. 의사들은 환자 한 명당 평균 11.8분을 써서 6.6개의 질문과 7.2개의 검사를 했다. 비용은 평균 2,963달러였지만 정확도는 19.9%에 그쳤다. 연구진은 "AI가 의사보다 정확한 이유는 AI가 일반의와 전문의의 지식을 모두 가지고 있기 때문"이라고 설명했다. 실제 병원에서는 복잡한 병이 있으면 여러 전문의에게 의뢰해야 하지만, AI는 혼자서도 모든 분야의 지식을 활용할 수 있다는 것이다.

FAQ

Q: 이 AI가 실제 병원에서 사용될 수 있나요?

A: 아직은 연구 단계입니다. 실제 환자를 치료하려면 더 많은 검증과 승인 과정이 필요합니다. 하지만 의사가 부족한 지역이나 응급상황에서 진단을 도와주는 도구로 사용될 가능성이 높습니다.

Q: AI가 의사를 완전히 대체할 수 있나요?

A: 아닙니다. 이번 실험은 매우 어려운 특수한 케이스들이었습니다. 실제 의료에서는 환자와 대화하고, 마음을 어루만지고, 윤리적 판단을 내리는 등 AI가 할 수 없는 일들이 많습니다. AI는 의사를 도와주는 보조 역할을 할 것으로 예상됩니다.

Q: 일반인도 이런 AI 진단을 받을 수 있게 될까요?

A: 미래에는 스마트폰 앱 형태로 간단한 진단 도움을 받을 수 있을지도 모릅니다. 하지만 안전성과 개인정보 보호 등 해결해야 할 문제들이 많아서 시간이 걸릴 것 같습니다.

해당 기사에 인용한 논문 원문은arxiv에서 확인 가능하다.

이미지 출처: 마이크로소프트

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

당첨후기	(수령인증) 2025 상반기 다나와 히트브랜드 세번째 이벤트 상품의견 이벤트!	M2 관성
자유게시판	이번주도 덥네요 (1)	L13 otosan
유머게시판	양송이버섯 안에 생기는 물 정체.....	L18 화월운
자유게시판	어제도 한의원 갔다가 저녁에 일찍 잠들었네요. (1)	M4 히이로진
입소문쇼핑	[★8월 십일절 최종 189만★] RTX5070 탑재 HP 오멘 게이밍 노트북 특별 할인 쿠폰 이벤트!	L7 (주)라이프웍스
입소문쇼핑	[단독특가569만!!!] ASUS ROG STRIX SCAR 16 G635LX-RW047W 게이밍노트북 U9 275HX RTX5090 2.5K MINI LED 32GB 2TB 애니미 매트릭스 Win11	L8 (주)아이티블루
취미 상품포럼	진짜 취향 저격 제대로예요	L5 장차될사람
쇼핑뉴스	[8/5 오후 5시] JBL 신상 이어폰/스피커 라이브 할인!	다나와
자유게시판	[주간랭킹] 이번주는 14위네요. (2)	M4 히이로진
기획뉴스	[숨신소] 아스타리온 성우 등 유명 배우 등장, 데드 테이크	게임메카
일반뉴스	[Q&AI] ‘극한직업’ 배우 송영규 사망… 왜?	AI matters
쇼핑뉴스	★10%환급★ 으뜸효율 가전제품 환급 신청 방법 알아보자 !	다나와
일반뉴스	‘K-AI’ 5개 정예팀 발표… LG·네이버·업스테이지·SKT·엔씨	AI matters
일반뉴스	오락가락하는 챗GPT 성격, 이유 찾았다… 앤트로픽, AI 성격 변화 실시간 감시 시스템 개발	AI matters
일반뉴스	565만 개 위키피디아 학습한 AI, 그림만 봐도 작가·시대 배경·비화까지 알려준다	AI matters
일반뉴스	'트랄랄레로 음성 생성' 일레븐랩스, 음성 생성 AI 시장 62% 점유율 독주 체제 구축	AI matters
일반뉴스	애플, 자체 AI 답변 엔진 'Answers' 개발 착수… 챗GPT 대항마 되나	AI matters
일반뉴스	보그, 게스 AI 모델 광고로 논란… "가짜 여성 쓰는 잡지 안 산다"	AI matters
일반뉴스	팀 쿡 "애플, AI에서 반드시 이겨야 한다" 전 직원에게 강조	AI matters
일반뉴스	"왜 GPT-5 개발에 우리 코딩 도구 쓰냐"… 앤트로픽, 오픈AI에 ‘클로드’ 접근 차단	AI matters
당첨후기	[수령 인증] 2025 상반기 다나와 히트브랜드 세번째 이벤트 상품의견 이벤트! (1)	M2 Or크ㅁr
입소문쇼핑	[11번가] 단독특가!!157만!!! LG 그램 프로 16 16Z90TP-GA5YK 울트라 U5-225H 초경량 1199g AI 노트북	L8 (주)아이티블루
일반뉴스	넷마블 ‘뱀피르’, “뱀파이어 세계관의 매력과 MMORPG 새로운 시도 보여줄 것”	게임동아
일반뉴스	“지난 30년 중 최악”… 美 상무부 승인 대란에 엔비디아 H20 칩 中 수출 지연	AI matters
자유게시판	화요일 오후네요 (2)	L20 아모스1
입소문쇼핑	디월트 DCD7781(5.0Ah, 배터리 1개) (195,800/10,000원) 구매찬스	쇼핑봇
입소문쇼핑	인기순위 상위권의 프로젝트엠 남성 밀라노 버튼카라 스웨터 EPF2ET1100, 저렴해졌어요	쇼핑봇
입소문쇼핑	인기순위 상위권의 여성5cm키높이 스니커즈LCWS82U413, 저렴해졌어요	쇼핑봇
입소문쇼핑	인기순위 상위권의 로퍼 LCWD62U313, 저렴해졌어요	쇼핑봇
입소문쇼핑	인기순위 상위권의 행복을파는사람들 정성곳간 강순의 도가니탕 800g(10개), 저렴해졌어요	쇼핑봇
입소문쇼핑	랩골프 OZ.1 퍼터(병행) (712,500/무료배송) 구매찬스	쇼핑봇
입소문쇼핑	랩골프 MEZZ.1 퍼터(병행) (687,000/무료배송) 구매찬스	쇼핑봇
입소문쇼핑	인기순위 상위권의 테일러메이드 밀드 그라인드3 크롬 웨지(정품), 저렴해졌어요	쇼핑봇
입소문쇼핑	테일러메이드 Qi10 LS 디자이너 시리즈 커스텀 드라이버+벤투스 샤프트(블루 정품) (559,500/무료배송) 구매찬스	쇼핑봇
입소문쇼핑	[쿠팡] HP 255 G10 B7NK1AT 16GB Win11 사무용 노트북 쿠팡 사전예약 판매 진행 중!	L7 (주)라이프웍스
기획뉴스	[기자 수첩] 람보르기니 화재 "주유 중 시동 끄지 않았다면 성냥 켠 것"	오토헤럴드
일반뉴스	‘렉서스·토요타 안심 플러스 서비스 캠페인'... 견인 서비스 최대 50km	오토헤럴드
일반뉴스	SUV 대형화, 보행자 안전 위협…美 IIHS “운전자 시야 최대 58% 감소”	오토헤럴드
일반뉴스	총 942개 백라이트 도트, 벤츠 그릴 화려한 변신... 신형 GLC 최초 탑재	오토헤럴드
일반뉴스	대만 폭스콘 '전기차 사업 백기' 옛 제너럴모터스(GM) 공장 3년 만에 매각	오토헤럴드
일반뉴스	[EV 트렌드] 흔들리는 테슬라… 유럽 시장 점유율 21% → 14%로 추락	오토헤럴드
기획뉴스	"빨간불에 달려도 된다?" 신호 무시하고 달려도 합법인 '데드 레드'법	오토헤럴드
일반뉴스	한국타이어, 포뮬러 E 시즌11 ‘베스트 팬 익스피리언스 오브 더 이어’ 수상	오토헤럴드
일반뉴스	현대차, 첫 해외 브랜드 팬덤 ‘현대모터클럽 재팬’ 출범...일본 내 인지도 제고	오토헤럴드
일반뉴스	리 오토, 8톤 트럭 정면충돌 영상 공개...체면 구긴 트럭 제조사 고소 대응	오토헤럴드
일반뉴스	뜨거운 여름 휴가 시즌, 떠날때 원픽하고 싶은 개성 강한 스포츠카는	오토헤럴드
기획뉴스	[김흥식 칼럼] "죽거나 말거나" 일론 머스크, 레벨2 운전보조시스템 홍보	오토헤럴드
일반뉴스	벤틀리서울, ‘벤테이가 엑스트라오디너리 썸머’ 진행...국내 누적 1000대 예고	오토헤럴드
일반뉴스	F1 2025 헝가리 GP 리뷰: 노리스 9승째, 해밀턴 부진…여름 휴식 전 희비 엇갈린 드라이버들	글로벌오토뉴스
일반뉴스	루이스 해밀턴, 헝가리 GP에서 자책 발언…“나는 쓸모없다”	글로벌오토뉴스
일반뉴스	BYD, 7월 생산량 17개월 만에 감소…PHEV 부진에 제동 걸린 성장세	글로벌오토뉴스
일반뉴스	메르세데스-벤츠, 2026년 한 해에만 신차 18종 출시 예고	글로벌오토뉴스
일반뉴스	메르세데스-벤츠, 픽셀 그릴·하이퍼스크린 적용한 GLC EV 공개 임박	글로벌오토뉴스
일반뉴스	SK이노베이션, SK온·SK인무브 합병 결정	글로벌오토뉴스
일반뉴스	마그나, 차량 내 센서 기술로 아동 안전 강화	글로벌오토뉴스
일반뉴스	닛산 전성기의 디자인 다시 보기	글로벌오토뉴스
일반뉴스	[영상] 중국차 불신 넘을까? BYD 씰의 실체를 파헤치다	글로벌오토뉴스
일반뉴스	보그워너, 중국서 전기 모터 수주... NEV 시장 공략 가속화	글로벌오토뉴스
일반뉴스	CATL, 독일 튀링겐 전원 배터리 공장 가동 중... 유럽 전역 공급	글로벌오토뉴스
일반뉴스	EU, 2040년 배출량 90% 감축 목표 제안... '그린딜' 새 국면 맞아	글로벌오토뉴스
일반뉴스	일본 자동차 4사, 7월 미국 판매량 11.1% 증가... 토요타 20% 가까이 급증	글로벌오토뉴스
일반뉴스	토요타, 2025년 글로벌 생산량 '1,000만 대' 전망... 2년 만에 최고치 근접	글로벌오토뉴스
일반뉴스	BYD, 올 상반기 250만 대 판매 육박... 전년대비 27% 증가	글로벌오토뉴스
일반뉴스	테슬라, 차체 앞부분 기가캐스트 강판으로 회귀... 핫스탬핑 방식 채용한 업체도	글로벌오토뉴스
일반뉴스	유럽 31개국 상반기 신차 판매 0.9% 감소	글로벌오토뉴스
일반뉴스	마세라티, 전기 슈퍼카 'MC20' 출시 보류... "수요 부족"	글로벌오토뉴스
일반뉴스	온세미, 샤오미 YU7 전기SUV 라인업에 최신 EliteSiC 기술 지원	글로벌오토뉴스
일반뉴스	한국자동차연구원, 미래 모빌리티 기술 선점 위해 조직 개편	글로벌오토뉴스
일반뉴스	현대차 첫 해외 브랜드 팬덤 ‘현대모터클럽 재팬’ 출범	글로벌오토뉴스
일반뉴스	한국타이어, 포뮬러 E 시즌11 ‘베스트 팬 익스피리언스 오브 더 이어’ 수상	글로벌오토뉴스
일반뉴스	아우디 코리아, 아우디 석촌 서비스센터 신규 오픈	글로벌오토뉴스
일반뉴스	보그워너, 동아시아 주요 OEM 업체와 하이브리드 차량용 터보차저 공급 계약 체결	글로벌오토뉴스
일반뉴스	오토노머스에이투지, 日 자율주행 시장 진출… 가네마쯔와 MoU 체결	글로벌오토뉴스
일반뉴스	7월 수입 승용차 27,090대 신규등록	글로벌오토뉴스
일반뉴스	벤틀리서울, 8월 전국 전시장서 ‘벤테이가 엑스트라오디너리 썸머’ 행사 진행	글로벌오토뉴스
입소문쇼핑	AGON OLED 게이밍 모니터를 빠르게 만나는 방법!	L7 알파스캔 Displays
자유게시판	더위 오래가네요 (5)	L15 HomeRun
입소문쇼핑	[무신사] 초특급 할인 진행 중! Razer BlackShark V2 Pro	L8 SRISE
입소문쇼핑	★G마켓만 단독특가179만★ASUS TUF A18 RTX5070 FA808UP-S8017 게이밍노트북	L8 (주)아이티블루
입소문쇼핑	[지마켓] 8월 단독특가49만!!! ASUS ExpertBook P1 P1503CVA-S70532 인텔 i5-13420H AI 노트북	L8 (주)아이티블루
일반뉴스	구글이 만든 '지구 관찰 AI', 위성사진으로 전 세계 농작물·산림 상태 한눈에 파악한다	AI matters
취미 상품포럼	리메이크 월드라고 신청 받던데	L5 꺄아울
일반뉴스	"AI에게 우울하다고 하지 마세요"… 챗GPT에 슬프다고 하면 거짓말 75% 더 많이 해	AI matters
신상품뉴스	마누스, 코더·디자이너·매니저가 수백 가지 일 함께하는 '와이드 리서치' 기능 출시	AI matters
일반뉴스	오픈AI, 11조 원 추가 투자 유치… 기업가치 416조로 급등	AI matters
입소문쇼핑	[G마켓] 퍼플랩 PC, 지포스 RTX 50 시리즈 탑재 완본체 라인업	L7 TU1148
입소문쇼핑	[롯데아이몰] LG 그램 디지털 신학기전 특가 혜택	L5 LG공식인증점
신상품뉴스	에이수스, 강력한 AI 성능 갖춘 코파일럿+ 노트북 ‘비보북 S16’ 및 ‘비보북 S14’ 출시	뉴스탭
신상품뉴스	바노바기 자회사 반가운 웰니스, 고용량 ‘바노 비타민C 3000mg’ 출시	뉴스탭
일반뉴스	쏠비치 양양·삼척, 바다와 노을을 배경으로 즐기는 '야외 BBQ존' 운영	뉴스탭
일반뉴스	BBQ, 창사 30주년 맞아 8월 한 달간 BBQ앱 주문 고객 대상 5만 원 상당 쿠폰 혜택 제공	뉴스탭
쇼핑뉴스	롯데렌터카, '부산 웰컴 쿠폰팩' 출시…부산·김해 인기 관광지 최대 50% 할인	뉴스탭
일반뉴스	코나투스, 경기·강원서 '투루택시' 본격 운영…지역참여형 가맹택시 모델 확산	뉴스탭
일반뉴스	에이서, ‘에이서 데이 2025’ 개최…기술로 한계를 넘어서는 글로벌 캠페인 전개	뉴스탭
신상품뉴스	그래비티, KAIST 기술 기반 ‘디스커버리 트래블 세트’ 출시…올리브영 온라인 기획전 진행	뉴스탭
일반뉴스	“가볍게 한 잔, 기분 전환 OK” 여름철 저도수 주류가 뜬다	뉴스탭
일반뉴스	NOL 인터파크투어, ‘정글리아’ 포함 오키나와 맞춤 패키지 첫선	뉴스탭
신상품뉴스	K2, 냉감 시어서커 소재로 무더위 겨냥한 '시원서커 우븐 반팔 후디' 출시	뉴스탭
일반뉴스	삼성디스플레이, 2분기 중대형 OLED 출하량 58.2% 급증…노트북용 수요가 성장 견인	뉴스탭
쇼핑뉴스	코지마, 창립 80주년 기념 고객 감사 프로모션 실시…안마의자 최대 67% 할인	뉴스탭

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

"AI 의사가 인간 의사보다 4배 정확"... MS 의료 AI, 80% 진단 성공률 달성

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

"AI 의사가 인간 의사보다 4배 정확"... MS 의료 AI, 80% 진단 성공률 달성

공유하기

공감/비공감