GPT-4o, 경제 전문가만큼 정확하게 미래 경제 예측... "복잡한 프롬프트 필요없다" : 다나와 DPG는 내맘을 디피지

인공지능(AI) 챗봇 GPT-4o가 경제 전문가들과 비슷한 수준으로 경기 전망을 내놓을 수 있다는 연구 결과가 나왔다. 하지만 AI에게 "당신은 경제학 박사입니다"처럼 자세한 역할을 부여하는 복잡한 질문 방식은 예측 정확도를 높이는 데 전혀 도움이 되지 않았다. 이탈리아 중앙은행 연구진이 발표한 이번 연구는 AI 기반 경제 예측 시스템을 만들 때 어떤 점에 집중해야 하는지 중요한 힌트를 제공한다.

2,368가지 '경제 전문가 캐릭터'로 12년 치 경제 예측 실험

연구진은 PersonaHub라는 3억 7천만 개의 전문가 설명을 담은 데이터베이스에서 경제학과 관련된 2,368개의 전문가 캐릭터를 뽑아냈다. 이 캐릭터들은 "유럽 중앙은행 정책을 연구하는 경제학자" 같은 식으로 각각 다른 전문 분야를 가진 가상의 인물들이다. 연구진은 이 캐릭터들을 GPT-4o에 입력해 유럽중앙은행(ECB)이 실제로 진행하는 '전문 예측가 설문조사(SPF)'를 따라 해 보았다.

2013년 1분기부터 2025년 2분기까지 분기마다 진행된 50회의 설문을 재현했고, 조화소비자물가지수(HICP) 인플레이션, 근원 HICP, 실질 GDP 성장률, 실업률 등 4개 주요 경제 지표를 예측하게 했다. 이 과정에서 총 118,400개의 AI 예측값이 만들어졌다. 특히 2024년 1분기부터 2025년 2분기까지의 데이터는 GPT-4o의 학습 컷오프 시점인 2023년 10월 이후의 경제 상황이어서, AI가 전혀 학습하지 못한 미래를 얼마나 잘 예측하는지 확인할 수 있었다.

"경제학자 역할" 부여해도 예측력 그대로... 프롬프트 복잡하게 만들 필요 없어

연구에서 가장 놀라운 발견은 AI에게 자세한 역할 설명을 해줘도 예측 성능이 나아지지 않는다는 점이었다. 연구진은 상세한 페르소나 설명을 포함한 질문과, 페르소나 설명 없이 기본적인 과제 설명만 제공한 100개의 베이스라인 질문을 비교했다.

100개의 기본 질문으로 5,000개의 예측값을 만들어 비교 분석한 결과, 두 방식 사이에 통계적으로 의미 있는 차이가 전혀 발견되지 않았다. 통계 분석 결과 오차 분포가 사실상 구별 불가능한 것으로 나타났다. 이는 정교한 페르소나 엔지니어링이 예측 정확도에 기여하지 않으며, 계산 비용 절감을 위해 생략할 수 있음을 시사한다. 연구진은 모델 성능이 질문의 정교함보다는 데이터 품질과 과제 구조화에 더 크게 의존한다고 분석했다.

AI와 인간 전문가, 예측 정확도는 비슷... 하지만 AI는 '만장일치' 경향 뚜렷

평균절대오차(MAE)를 분석한 결과, AI와 실제 경제 전문가들의 정확도는 놀랍도록 유사했다. 표본 내 데이터(2013-2023년)의 16개 비교 항목 중 7개에서 완전히 똑같은 오차를 기록했고, 나머지도 대부분 근소한 차이만 보였다. 일부 분야에서는 AI가 더 정확했다. 예를 들어 2년 후 GDP 성장률 예측에서 AI의 오차는 0.60이었고 인간은 0.90이었다. 표본 외 데이터(2024-2025년)에서 올해 실업률 예측에서도 AI가 0.05로 인간의 0.15보다 3배 정확했다. 반면 인간이 더 잘한 분야도 있었다. 표본 내 데이터의 올해 실업률 예측에서 인간은 0.10, AI는 0.20의 오차를 보였고, 표본 외 데이터의 올해 HICP 인플레이션 예측에서도 인간이 0.01로 AI의 0.10보다 훨씬 정확했다.

흥미로운 점은 AI 예측자들의 의견 차이가 인간보다 극도로 작았다는 것이다. 2,368개의 다른 캐릭터를 사용했는데도 AI가 내놓은 예측값들은 거의 비슷했다. AI 페르소나들의 의견 분산은 인간 전문가들보다 약 2자릿수 낮은 수준이었다. 인간 전문가들은 같은 질문에도 상당한 의견 차이를 보였지만, AI는 다양한 캐릭터 설정에도 불구하고 상당히 동질적인 예측값으로 수렴하는 경향을 보였다.

학습 안 한 미래 경제도 잘 맞춰... 단, 분야별로 장단점 달라

승률 분석 결과, AI와 인간의 성능 차이는 통계적으로 유의미했지만 실질적으로는 미미한 수준이었다. 모든 비교에서 통계적 유의성이 나타났지만, 많은 경우 승률 차이가 상대적으로 좁았다. 특히 인플레이션 예측에서는 승률 차이가 종종 작은 폭에 그쳤다. 경제 지표별로 보면 AI는 근원 인플레이션(HICPX) 예측에서 대부분의 예측 기간에 걸쳐 일관되게 우수한 성과를 보였다. 반면 인간은 단기 GDP 성장률과 실업률 예측에서 우위를 보였지만, 이 우위는 예측 기간이 길어질수록 점차 감소했다.

표본 외 데이터 결과는 더 불안정한 양상을 보였으며, 표본 내 데이터와 비교해 일부 성과 역전 현상이 관찰됐다. 제한된 표본 외 관측치로 인해 이러한 역전 현상이 진정한 성능 차이를 반영하는 것인지, 2021년 이후 기간의 구조적 변화인지, 아니면 단순히 소표본 변동성인지 판단하기 어렵다. 중요한 점은 GPT-4o가 학습 데이터에 전혀 포함되지 않은 2024~2025년 경제 상황에 대해서도 경쟁력 있는 예측 성능을 유지했다는 것이다.

표본 내 기간 대비 주목할 만한 차이가 있었지만, 표본 내 기간에서 표본 외 기간으로의 전환에서 체계적인 성능 저하는 나타나지 않았다. 이는 모델이 관련 맥락 데이터가 제공되면 단순히 암기된 패턴에 의존하기보다는 프롬프트에 제공된 실시간 경제 맥락 정보를 효과적으로 활용한다는 것을 시사한다.

FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. '페르소나 프롬프팅'이 뭔가요? 왜 효과가 없었나요?

A: 페르소나 프롬프팅은 AI에게 "당신은 거시경제학과 국제무역을 전문으로 하는 정치경제학자입니다"처럼 구체적인 전문가 역할을 부여하는 상세한 설명을 프롬프트에 포함시키는 기법입니다. 이번 연구에서는 2,368개의 서로 다른 경제 전문가 페르소나를 사용했지만, 이러한 정교한 설명이 예측 정확도 향상에 전혀 기여하지 못했습니다. 예측 성능은 프롬프트의 복잡성보다는 제공되는 데이터의 품질과 과제 구조화 방식에 더 크게 의존하는 것으로 나타났습니다.

Q2. GPT-4o의 경제 예측은 얼마나 정확한가요?

A: 실제 경제 전문가들과 거의 같은 수준입니다. 예를 들어 물가 상승률을 예측할 때 AI의 평균 오차는 0.20, 인간 전문가는 0.19로 거의 차이가 없었습니다. 어떤 분야에서는 AI가 더 잘했고(2년 후 GDP 성장률 예측에서 0.60 대 0.90) 어떤 분야에서는 인간이 더 잘했지만(표본 내 올해 실업률 예측에서 0.20 대 0.10), 전체적으로는 통계적으로 유의미하지만 실질적으로는 미미한 차이를 보였습니다.

Q3. AI 예측자들의 '의견 분산이 낮다'는 게 무슨 뜻인가요?

A: 2,368개의 서로 다른 전문가 캐릭터를 사용했는데도 AI가 내놓은 예측값들은 거의 비슷했다는 뜻입니다. AI 페르소나들의 의견 분산은 실제 인간 전문가들보다 약 2자릿수 낮은 수준을 보였습니다. 이는 다양한 페르소나 프롬프트에도 불구하고 모델이 상당히 동질적인 예측값으로 수렴하며, 인간 패널과 비교해 극도로 낮은 의견 불일치를 보인다는 것을 의미합니다. 이는 현재 LLM 기술이 진정한 의견 다양성을 생성하는 데 제한적 민감성을 가지고 있음을 시사하며, 실제 예측 시스템 구축 시 고려해야 할 중요한 행동 특성입니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문명: Prompting for Policy: Forecasting Macroeconomic Scenarios with Synthetic LLM Personas

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

나 아직 살아있다! 위력 과시하는 '위저드리'와 '마이트앤매직' (1)	게임동아
폭스바겐, 전기 구동장치 500만대 돌파 'APP550'로 전동화 가속	오토헤럴드
'보배도 당근도 넘지 못한 장벽' 독주하는 중고차 1위 플랫폼은 '요기요'	오토헤럴드
토요타의 전설 '하이랜더' 3열 전기 SUV로 복귀, 기존 네이밍 전략 수정	오토헤럴드
한국타이어, ‘2026 가장 존경받는 기업’ 타이어 부문 17년 연속 1위	오토헤럴드
벤틀리, 극한의 오프로드 퍼포먼스 극대화 ‘벤테이가 X 콘셉트’ 공개	오토헤럴드
'뼈대부터 차별화' 제네시스, 전용 전동화 플랫폼으로 프리미엄 전략 재정렬	오토헤럴드
설 연휴 2780만명 대이동, 정부 통행료 면제 등 특별교통대책 시행	오토헤럴드
'휴먼 에러 줄어들까' 고령 택시·화물차 ‘페달오조작 방지장치’ 보급	오토헤럴드
5등급차 조기폐차ㆍ매연저감장치 지원 올해 종료, 늦기전 신청해야	오토헤럴드
페라리, 조니 아이브와 협업한 첫 순수 전기차 '루체' 공개	글로벌오토뉴스
2026년 런던, 미국과 중국 자율주행 기술의 글로벌 격전지 된다	글로벌오토뉴스
발레오·안리츠, SDV 가상 검증 협력… 디지털 트윈으로 개발 주기 단축	글로벌오토뉴스
니오, 배터리 교환 누적 1억 건 돌파… 전기차 충전 패러다임 전환	글로벌오토뉴스
중국 전고체 배터리 연합(CASIP) 가동… 2026년 실험실 넘어 도로 위로	글로벌오토뉴스
테슬라, 중국 내 AI 교육 센터 본격 가동… FSD 현지화 공세 박차	글로벌오토뉴스
위라이드·우버, 중동 로보택시 대 공습… 2027년까지 1,200대 투입	글로벌오토뉴스
LG엔솔, 스텔란티스 넥스트스타 에너지의 지분 100달러에 인수, 배터리 합작 종료	글로벌오토뉴스
미쉐린, 현대차 ‘더 뉴 엑시언트 수소전기트럭’에 신차용 타이어 공급	글로벌오토뉴스
벤틀리, 'FAT 아이스 레이스 2026'서 벤테이가 X 콘셉트 및 신차 공개	글로벌오토뉴스
BYD코리아, 17개 전국 서비스센터에서 설 맞이 무상점검 서비스 캠페인 실시	글로벌오토뉴스
KGM, ‘2026년 설 맞이 차량점검 서비스’ 시행	글로벌오토뉴스
쉐보레, 동남권 고객 접근성 강화 위한 '해운대 전시장' 공식 오픈	글로벌오토뉴스
[컨슈머인사이트] 보배드림·당근마켓이 중고차에서 힘 못쓰는 이유는?	글로벌오토뉴스
캐딜락 F1 팀, 2026 시즌 데뷔 경주차 리버리 전격 공개	글로벌오토뉴스
BYD, 미국 정부 상대 관세 환급 소송 제기…중국 자동차 제조사 중 처음	글로벌오토뉴스
스텔란티스, ‘전기차 과대평가’ 인정하며 38조 원대 손실 반영	글로벌오토뉴스
볼보 CEO, 한·미·유럽 관세 전쟁 속 '정면 돌파' 선언	글로벌오토뉴스
메르세데스-벤츠 CEO, 유럽 EU 내연기관 금지 완화에 "불확실성만 가중" 경고	글로벌오토뉴스
올리비아로렌, ‘타임 투 블룸’으로 봄을 깨우다…2026 봄 컬렉션 공개	뉴스탭
오늘의집, 봄 신학기 맞아 ‘2026 새학기대전’…가구·디지털 한자리에	뉴스탭
“새 학기 몰입을 잡아라” 소니 WH-1000XM6 구매하면 전용 스탠드 증정	뉴스탭
“고르는 재미까지 선물한다”… 포트넘 앤 메이슨, 설 맞이 맞춤형 기프트 박스 선봬	뉴스탭
글로벌 TOP10 원작, 인도네시아 소설 『시가렛 걸』 드디어 한국 상륙	뉴스탭
숲(SOOP), 다가오는 명절 풍성하게 2026 설 특집 페이지 공개	게임동아
예스24, 아시아 최대 도서전서 ‘크레마 연필 리모컨’ 첫 해외 공개…글로벌 시장 가능성 확인	뉴스탭
고향 대신 집, 설 선물도 달라졌다… ‘쉼을 주는 가전’이 뜬다	뉴스탭
한국인 F1 직관 어디로 떠나나…상하이·바르셀로나·스즈카 ‘톱3’	뉴스탭
인텔 코어 Ultra, 게임부터 AI까지… ‘All-Play, All-AI’ 프로모션 진행	뉴스탭
게임리서치 ‘묵혼온라인’, 설 및 발렌타인데이 맞이 이벤트 진행!	게임동아
데스윙, 성공했구나! 하스스톤 '대격변' 확장팩 공개	게임메카
“유니티·언리얼 비용 부담”... 자동차 회사 ‘토요타’가 직접 차량용 게임 엔진 만든다	게임동아
호요버스 ‘붕괴: 스타레일’, '포트나이트'와 컬래버레이션	게임동아
‘명조:워더링 웨이브’, 명조 X 컴포즈커피’ 전국 컬래버레이션 시작	게임동아
카카오게임즈, SMTOWN 후쿠오카 콘서트에서 슴미니즈 홍보	게임동아
에픽게임즈 스토어, ‘2026 겨울 세일’ 돌입	게임동아
넷마블, 신작 MMORPG '솔: 인챈트' 3월 5일 사전등록 돌입	게임동아
“33원정대의 성공 인정”... 프랑스 정부, 샌드폴 인터랙티브 개발진 28명에게 기사 작위 수여	게임동아
‘월드 오브 워쉽’, 15.1 업데이트 "신년 달맞이 이벤트 진행"	게임동아
컴투스 메인넷 CONX, 순환형 RWA 프로젝트 ‘주재범 아레나’ 수상작 발표	게임동아
하스스톤, '스포트라이트 2026'과 함께 차기 확장팩 '대격변' 공개	게임동아
네오위즈, 2025년 당기순이익 458억 원으로 흑자전환.. 영업익은 600억 원	게임동아
글로벌 시리즈 연 12회, 배그 e스포츠 2026 로드맵 공개	게임메카
원작 액션 살렸다, 몬헌 아웃랜더스 무기 소개 영상 공개	게임메카
크래프톤 "배그 모바일, 작년 중국서 DAU 두 자릿수 성장"	게임메카
[오늘의 스팀] ‘압긍’ 받는 요리판 발라트로, 정식 출시	게임메카
불법복제 게임 미끼로, PC 40만 대에 악성코드 퍼졌다	게임메카
인텔 공인대리점 '모든 가능성을 만들다: All-Play, All-AI' 프로모션 실시	다나와
위메이드플레이, 2025년 매출 1253억 원, 영업익 107억 원, 당기순익 214억 원 기록	게임동아
대원씨티에스, ASUS ROG 및 TUF 게이밍 기어 유통 계약 체결	다나와
엔씨소프트 북미법인 퍼블리싱 총괄에 ‘머빈 리 콰이’ 영입	게임동아
NHN, 수집형 RPG '어비스디아' 출시 임박…버스 랩핑 등 이색 옥외광고 '러시'	게임동아
‘바이오하자드 서바이벌 유닛’ 대만·홍콩 전략 게임 1위 달성	게임동아
포트나이트, 케데헌과 두 번째 컬래버로 골든 의상 헌트릭스와 '진우' 등장	게임동아
일러스트 제작 과정도 공개! 일러스트레이터 카노가 '매력적인 컨셉'을 창출하기 위해 하고 있는 일	게임동아
일러스트 제작의 뒷면도 공개! 크리에이터 Okku가 소중히 하는 창작 마인드란?	게임동아
명조 X 컴포즈커피 세미팝업 프리오픈 성료	게임동아
불안감 커지는 한미 간 통상 불확실성, 車 업계 특별법 조속 제정 촉구 (1)	오토헤럴드
독일인 75% "구매 의향 없다" 수치로 확인된 테슬라 브랜드 이미지 급락 (1)	오토헤럴드
지난해 韓시장 269% 폭풍 성장 후 폴스타가 꺼내든 다음 카드 '초고성능'	오토헤럴드
[LCK] DN 수퍼스와 DRX의 대반란 속 '혼돈 속 LCK 컵'	게임동아
엄마-아빠도 게이머였다…넷플릭스 다큐멘터리가 선사하는 추억 여행 화제[게임 인더스트리] (1)	게임동아
바이오하자드 레퀴엠, "그레이스로 도망친 적도, 레온으로 쓰러뜨릴 수 있다" (1)	게임동아
크래프톤, 3년간 1조 원 이상 주주환원 추진	게임동아
캐킷 ‘럽플레이스’, 설맞이 ‘만복 대축제’ 대규모 업데이트	게임동아
웹젠, '드래곤소드' 신규 캐릭터와 콘텐츠 확장에 천장까지 완화	게임동아
엔씨 ‘리니지 클래식’, 이틀 만에 누적 접속자 50만, 최대 동접 18만 돌파	게임동아
엔씨 '리니지 클래식', PC방 순위 4위 등극.. 자동 플레이 시스템 도입 검토	게임동아
그라비티, 신작 ‘라그나로크 오리진 클래식’ 홍콩 지역 CBT 참가자 모집	게임동아
크래프톤, 2025년 연간 매출 3조 3,266억, 영업이익 1조 544억	게임동아
‘조선협객전 클래식’, 온라인 쇼케이스 통해 상세 정보 공개	게임동아
타일 한 칸에서 시작된 작은 왕국. '드랍 더치' 개발한 슬리피 밀 스튜디오	게임동아
[롤짤] 1만 골드차 역전까지, LCK 친정팀 파괴 메타	게임메카
아이작의 번제 개발자 신작 ‘뮤제닉’ 메타크리틱 90점 (1)	게임메카
문화적 공로, 33 원정대 개발진 전원 기사 작위 받았다	게임메카
공포게임 아닙니다, '토마스와 친구들' 기반 신작 발표	게임메카
메모리 부족, 엔비디아 올해 GPU 신제품 출시 안 한다?	게임메카
레이싱게임 '레이시티' 스팀 페이지 오픈, 진위 여부 화제	게임메카
3편 직후 이야기, 발더스 게이트 TV 드라마 발표 (1)	게임메카
패러독스 CEO “DLC 폭격에 대한 부담감 잘 알고 있다”	게임메카
[오늘의 스팀] 확률 없는 턴제 전략 신작 ‘메너스’ 출시	게임메카
[이구동성] 짜잔~ 2 라는 건 없군요	게임메카
3인 협동 기계수 토벌, 호라이즌 헌터즈 개더링 공개	게임메카
인어 먹으면 불로불사? 파라노마사이트 시리즈 최신작 발표	게임메카
도쿄 떠나 새 도시로, 팔콤 '교토 재너두' 베일 벗었다	게임메카
업데이트 종료됐던 그랑블루 리링크, 확장팩으로 부활한다	게임메카
닌텐도 다이렉트, 스위치 1·2로 출시될 신작 다수 공개	게임메카
'삼국지 전략판’, 코에이 테크모 ‘삼국지’ 시리즈 40주년 기념 참여	게임동아
[오늘의 스팀] 돌아온 탱크, 헬다이버즈 2 업데이트 관심	게임메카
완성도 높은 사무라이·닌자 액션, 인왕 3 메타크리틱 86점	게임메카

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

GPT-4o, 경제 전문가만큼 정확하게 미래 경제 예측... "복잡한 프롬프트 필요없다"

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

GPT-4o, 경제 전문가만큼 정확하게 미래 경제 예측... "복잡한 프롬프트 필요없다"

공유하기

공감/비공감