출처 : 챗GPT 생성 이미지
오픈AI(OpenAI)가 자사 인공지능 모델 ‘GPT-5’가 수학의 미해결 난제를 풀었다고 주장했다가 과장 논란에 휩싸였다.
발단은 오픈AI 부사장 케빈 와일(Kevin Weil)이 소셜미디어에 올린 게시물이었다. 그는 “GPT-5가 폴 에르되시(Paul Erdős)가 제시한 10개의 미해결 문제를 해결하고, 11개 문제에 추가 진전을 보였다”고 자랑했다. 하지만 해당 글은 곧 삭제됐다.
출처 : 케빈 와일 SNS
에르되시 난제(Erdős problems)는 수학자 에르되시 팔(Erdős Pál)이 남긴 미해결 수학 퍼즐들의 집합으로 '무한한 소수들 중 특정한 규칙을 따르는 집합이 존재할까?', '수의 분포가 특정 확률 규칙을 따를까?'와 같은 단순하지만 풀기 매우 어려운 문제 모음이다. 그중 일부는 이미 해결되었고, 일부는 여전히 ‘열린 문제(open problem)’로 남아 있다.
문제의 ‘에르되시 문제’ 목록을 관리하는 수학자 토머스 블룸(Thomas Bloom)은 즉각 반박에 나섰다. 그는 “내 웹사이트에 ‘미해결(open)’로 표시된 건 단지 내가 관련 논문을 보지 못했다는 뜻일 뿐, 실제로 해결되지 않았다는 의미가 아니다”라며 “GPT-5가 찾아낸 건 내가 몰랐던 기존 논문의 해답이었다”고 설명했다. 즉, GPT-5가 새로운 수학적 증명을 제시한 것이 아니라 이미 발표된 논문을 찾아낸 수준에 불과했던 셈이다. 오픈AI 연구원 세바스티앙 뷔벡(Sébastien Bubeck)도 이후 “문헌 속에서 해답을 발견한 것일 뿐”이라며 일부 과장된 표현을 인정했다.
경쟁사 반응은 냉담했다. 메타의 AI 수석 과학자 얀 르쿤(Yann LeCun)은 이번 사태를 두고 “스스로 만든 GPT에 당했다”고 비꼬았고, 구글 딥마인드 CEO 데미스 허사비스(Demis Hassabis)는 “참으로 부끄러운 일”이라고 직설적으로 평했다.
전문가들은 이번 논란이 AI 연구에서 ‘발견’과 ‘검색’을 구분하는 투명성이 얼마나 중요한지를 보여준다고 말한다. 실제로 GPT-5가 기존 문헌을 찾아내는 능력은 인상적이지만, 이를 ‘난제 해결’로 포장하는 순간 신뢰를 잃을 수 있다는 지적이다. 또 이번 해프닝은 AI가 과학적 성과를 주장할 때 얼마나 신중해야 하는지를 일깨운 사례로 남았다.
글 / 김지훈 news@cowave.kr
(c) 비교하고 잘 사는, 다나와 www.danawa.com