AI가 지도를 공부한 게 아니었다? 단어 패턴만으로 세계 지리를 꿰뚫는 충격 실험 : 다나와 DPG는 내맘을 디피지

내비게이션 앱도 아닌데, 지도 데이터도 없는데, AI가 "레이캬비크"라는 단어 하나만 보고 그 도시가 북쪽의 추운 곳이라는 걸 맞혔다면 믿겠는가. 플로리다 애틀랜틱 대학교(Florida Atlantic University)의 일란 바렌홀츠(Elan Barenholtz) 교수 연구팀이 2026년 3월 발표한 논문에서 10년 전 기술로 이것을 해냈다. 더 놀라운 건 최신 AI가 아니라 2013년에 만들어진 단어 통계 기술을 썼다는 점이다. 과연 AI는 세상을 '이해'하는 걸까, 아니면 글자들의 패턴을 '기억'하는 걸까.

단어가 모이면 지도가 된다

연구팀이 사용한 기술 이름은 글러브(GloVe)와 워드투벡(Word2Vec)이다. 둘 다 2013~2014년에 개발된, AI 세계에서는 꽤 오래된 기술이다. 이 기술들이 하는 일은 단순하다. "어떤 단어들이 같은 문장이나 문단에 자주 함께 등장하는가"를 숫자로 바꾸는 것이다. 예를 들어 "커피"와 "카페"는 자주 같이 나오니까 두 단어의 숫자가 비슷해지고, "커피"와 "눈보라"는 거의 같이 안 나오니까 숫자가 멀어진다. 이 숫자 덩어리를 300개 차원의 벡터(vector), 즉 방향이 있는 좌표라고 부른다.

연구팀은 이 숫자 좌표에 선형 회귀 프로브(linear regression probe)라는 탐색 도구를 붙였다. 프로브는 일종의 탐지기다. X선이 몸속을 들여다보듯이, 단어 좌표 안에 숨어 있는 정보를 꺼내 보는 장치라고 생각하면 된다. 연구팀은 전 세계 100개 도시 이름을 이 탐지기에 넣고 물었다. "이 단어 좌표 안에 위도와 경도 정보가 들어있나요?"

결과는 놀라웠다. 위도는 최대 87%, 경도도 비슷한 수준으로 맞혔다. 연평균 기온도 52%까지 예측했다. 반면 인구수, 국내총생산(GDP), 해발고도는 거의 맞히지 못했다. 이게 중요하다. 아무 정보나 다 나온 게 아니라, 특정 정보만 골라서 나온 것이다.

"파리"가 "프랑스"와 붙어다니는 이유

그렇다면 어떻게 단어 숫자에 지리 정보가 담겼을까. 연구팀은 2만 개의 영어 단어를 전부 뒤졌다. 각 단어가 86개 도시 이름과 얼마나 가까운지 계산하고, 그 거리가 실제 기온이나 위도와 얼마나 연관되는지 봤다.

답은 명쾌했다. 따뜻한 도시 이름 옆에는 "덩기(dengue, 열대 질병)", "사이클론(cyclone)", "코코넛(coconut)", "야자수(palms)"같은 단어들이 자주 붙었다. 차가운 도시 이름 옆에는 "화학자(chemist)", "물리학자(physicist)", "스키(skiing)"가 자주 등장했다. 이건 연구팀이 미리 골라서 넣은 단어들이 아니다. 2만 개 단어를 무작위로 분석했더니 저절로 이런 패턴이 나왔다.

여기서 핵심 발견이 나온다. 바로 국가 이름이었다. 연구팀은 일부러 국가 이름들을 지웠다. 글러브 좌표에서 국가 이름들이 차지하는 방향을 통째로 제거한 것이다. 그랬더니 위도 예측 정확도가 87%에서 76%로 떨어졌고, 기온 예측은 52%에서 36%로 뚝 내려갔다. 같은 수의 무작위 단어를 지웠을 때는 정확도가 거의 안 변했다. 즉, 국가 이름이 지리 정보를 전달하는 핵심 다리 역할을 하고 있었다.

이유는 일상 언어에 있다. 뉴스 기사에서 "방콕"은 늘 "태국", "열대", "아세안(ASEAN)"과 함께 나온다. "오슬로"는 "노르웨이", "피요르드(fjord)", "북유럽"과 같이 등장한다. 이런 동행이 수억 번 반복되면 단어 좌표 안에 지리적 지도가 저절로 새겨진다.

역사 인물 이름으로 시대를 추측하다

연구팀은 공간 정보에서 멈추지 않았다. 시간 정보도 실험했다. 호메로스(Homer, 기원전 800년경)부터 스티븐 호킹(Stephen Hawking, 1942년생)까지 역사적 인물 194명의 이름을 같은 방식으로 분석했다. "이 이름의 단어 좌표를 보면 이 사람이 언제 태어났는지 알 수 있을까?"라는 질문이었다.

정확도는 약 48~52%였다. 지리 정보보다는 낮지만 완전히 우연보다는 훨씬 높다. 탐지기가 고대(기원전~서기 500년), 중세(500~1400년), 근현대(1400년 이후)를 대략 구분하는 데 성공했다. "아인슈타인(Einstein)"이라는 이름 옆에는 "상대성이론", "20세기", "물리학"이 자주 붙고, "아리스토텔레스(Aristotle)"옆에는 "고대", "그리스", "철학"이 따라다닌 덕분이다.

지리 정보보다 시간 정보의 정확도가 낮은 것도 흥미롭다. 텍스트에서 공간은 명시적으로 자주 언급된다. "파리는 프랑스에 있다"는 문장은 넘쳐나지만, "나폴레옹은 1769년에 태어났다"는 문장은 상대적으로 드물다. 언어 자체가 공간에 대해 더 수다스럽다는 뜻이다.

AI 도구에는 어떤 도움이 될까

이 연구는 단순히 흥미로운 실험에 그치지 않는다. 실용적인 메시지도 담고 있다.

첫 번째는 비용과 효율이다. 요즘 챗GPT(ChatGPT)나 클로드(Claude) 같은 최신 대형 언어모델(LLM)은 수천억 개의 매개변수(parameter, AI가 학습하는 숫자 단위)를 가진다. 돌리려면 엄청난 전기와 서버가 필요하다. 하지만 이번 연구는 특정 작업에서는 300개 차원의 단순 단어 좌표만으로도 충분하다는 것을 보여줬다. 여행지 추천 앱이 도시 간 유사도를 계산하거나, 역사 문서를 시대별로 묶는 작업이라면 굳이 비싼 최신 AI를 쓸 필요가 없다는 뜻이다. 이는 전기 요금이나 서비스 비용을 크게 낮출 수 있다.

두 번째는 AI 연구 방법론의 경고다. 지금까지 많은 연구자들이 최신 AI의 내부 상태에서 지리나 시간 정보를 꺼낼 수 있다는 걸 발견하고 "AI가 세계 지도 같은 내부 모델을 만들었다"고 주장해왔다. 대표적으로 거니와 테그마크(Gurnee and Tegmark)가 2024년 라마-2(Llama-2)라는 대형 AI를 분석해 이런 주장을 펼쳤다. 바렌홀츠 교수 연구팀은 같은 방법으로 10년 전 기술을 분석해도 비슷한 결과가 나온다는 걸 보여주며 이렇게 말한다. "탐지기로 정보를 꺼낼 수 있다는 사실만으로는 AI가 진짜로 세계를 이해한다고 말할 수 없다."

냉장고 비유를 생각해보자. 냉장고에서 음식 냄새가 난다고 해서 냉장고가 요리를 이해한다고 말하진 않는다. 냄새는 그냥 음식이 거기 있었다는 흔적이다. AI에서 지리 정보가 나온다는 것도, 텍스트 원래부터 그 패턴이 있었다는 흔적일 수 있다.

세 번째는 언어 자체에 대한 새로운 시각이다. 이 연구가 진짜 놀라운 이유는 AI의 한계를 보여주는 게 아니라, 인간 언어의 풍부함을 새롭게 발견했기 때문이다. 우리가 매일 쓰는 문장들이 쌓이면 그 안에 지리, 기후, 역사가 고스란히 담긴다. 언어는 세상의 압축본이다.

FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q. 이 연구는 챗GPT 같은 AI가 세상을 이해 못 한다는 뜻인가요?

A. 꼭 그렇지는 않습니다. 이 연구는 AI가 지리나 시간 정보를 보여준다는 증거가 사실 텍스트 속에 원래부터 있던 패턴일 수 있다고 지적합니다. AI가 진짜로 세상을 이해하는지, 아니면 단어 패턴을 재현하는지는 여전히 학계에서 논의 중입니다. 다만 탐지기로 정보를 꺼낼 수 있다는 사실만으로 '진짜 이해'를 증명할 수는 없다는 것이 이 연구의 핵심입니다.

Q. 10년 된 기술로도 된다면 굳이 최신 AI를 써야 하나요?

A. 용도에 따라 다릅니다. 오래된 단어 통계 기술은 맥락을 구분하지 못합니다. '사과'가 과일인지 애플(Apple) 회사인지 모르고, 문장을 만들거나 대화를 이어가는 것도 불가능합니다. 최신 AI는 이런 복잡한 맥락 이해와 생성 능력에서 압도적으로 뛰어납니다. 단, 도시 유사도 비교나 시대 분류처럼 단순한 작업이라면 굳이 비싼 AI를 쓸 필요가 없을 수 있습니다.

Q. 이 연구 결과가 실생활에서 어떻게 도움이 되나요?

A. 여행 앱, 역사 교육 콘텐츠, 문서 자동 분류 시스템 같은 서비스를 만들 때 훨씬 저렴하고 가벼운 기술을 선택할 수 있다는 힌트를 줍니다. 또한 AI를 연구하는 분들이라면, 새로운 AI 실험 결과를 해석할 때 "이게 진짜 새로운 능력인가, 아니면 텍스트에 원래 있던 패턴인가"를 꼭 비교해봐야 한다는 교훈을 얻을 수 있습니다.

기사에 인용된 논문 원문은 arXiv에서 확인할 수 있다.

논문명: World Properties without World Models: Recovering Spatial and Temporal Structure from Co-occurrence Statistics in Static Word Embeddings

이미지 출처: AI 생성 콘텐츠

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

[정보/루머] 물 들어올 때 노 저으려는 인텔, PC 시장 도전을 멈추지 않을 퀄컴 등 (1)	다나와
AI의 무기화 시작한 美 정부, 'LLM'은 어떻게 알고리즘 전쟁의 종심이 됐나 (1)	IT동아
집에서 쓰는 챗GPT가 직장보다 2배 더 효율적인 충격적 이유	AI matters
AI가 지도를 공부한 게 아니었다? 단어 패턴만으로 세계 지리를 꿰뚫는 충격 실험	AI matters
AI도 시험 도중 실수를 고친다, 기존보다 5배 빠른 학습의 비밀	AI matters
교토를 향긋하게 음미하는 방법 [이성균 기자의 M-SG] (1)	트래비
[황성진의 '고대 사상가, AI를 만나다'] 아리스토텔레스가 보면, 요즘 AI 활용은 전부 '반쪽짜리'	IT동아
볼보 EX60, 세계 최초 체형 분석 ‘멀티 어댑티브 안전벨트’ 적용	오토헤럴드
'텔루라이드도 가능한 일' 혼다, 美 생산 SUV '패스포트' 일본 역수입	오토헤럴드
[EV 트렌드] '흔들리는 BYD' 中 내수 36% 급감, 경쟁 브랜드 맹추격	오토헤럴드
충전료 갑자기 50% 인상? 왜 이런 황당한 일이? 동영상 있음	오토기어
아이폰17e, M4 아이패드 에어 '가격 동결'에 속지 말 것! 살까말까 딱 정해드림 동영상 있음	주연 ZUYONI
벼랑 끝에 내 몰린 중국 전기차 "싸면 다 용서 된다?" 동영상 있음	오토기어
한국인이 잘 모르는 마카오 숨은 여행지&맛집 6 (1)	트래비
바르셀로나 근교 여행? '가우디 고향' 추천!	트래비
스팀 노출 증가 위한 인디 개발자용 홍보 전략 모음	게임메카
[순정남] 게이머들을 낚은 성우 라인업 트릭 TOP 5	게임메카
AI가 쓴 코드, 누가 만들었는지 밝혀낸다…챗GPT vs 클로드 판별 성공 (1)	AI matters
말만 하면 AI가 생각을 정리해주는 시대, '오럴리티'가 바꾸는 사고의 방식	AI matters
파네시아, SKT AI DC·오픈칩 등 국내외 전략적 협업 통해 글로벌 시장에 '발돋움'	IT동아
“프리미엄 내려놓고 99만 원” 애플, 중저가 노트북 맥북 네오 공개	IT동아
키보드ㆍ마우스ㆍ헤드폰 속 2.4GHz 무선ㆍ블루투스 기술의 차이점은?	IT동아
디노티시아, 추론 특화 ‘AI 스토리지’로 전 세계 AI 효율화에 도전장	IT동아
2월 DDR5 메모리 고점대비 30% 하락, 안정화의 신호탄인가 잠깐의 조정인가? [메모리 가격 폭등 6부] 동영상 있음	보드나라
M5 시리즈로 업그레이드, 애플 신형 맥북과 스튜디오 디스플레이 시리즈 발표	보드나라
[김훈기 칼럼] '전쟁과 유가 그리고 전기차' 車 산업의 또 다른 전환점	오토헤럴드
웨이모 자율주행 택시, 이번에는 총격 현장 출동 구급차 진로 방해 논란	오토헤럴드
현대차 美 진출 40년, 1회용 차 엑셀에서 모빌리티 혁신 기업으로 성장	오토헤럴드
바르셀로나 필수 코스! 가우디 건축 BEST 7 (1)	트래비
K-테크 뷰티의 정수, DDP 체험형 전시 공간 ‘비더비(B the B)’에 가다	IT동아
AI가 시각장애인의 'DIY 설명서' 읽어주면 절반은 틀린다	AI matters
AI가 연구자 대신 논문 댓글까지 분류한다, 단돈 6천 원으로 5만 건을	AI matters
현대차·기아 변신 로봇 '모베드' 상용화, 실증 지원 얼라이언스 출범 (1)	오토헤럴드
IT 축제와 시작되는 캠퍼스의 봄... ‘2026 인텔®&다나와 아카데미 페스티벌’	다나와
엔비디아의 CPU 침공? 미디어텍과 손잡은 노트북 SoC 루머, 어디까지 왔나 (2)	다나와
신학기 최고의 AI 노트북 모여라! ‘2026 인텔®&다나와 아카데미 페스티벌’ 시작	다나와
[EV 트렌드] BYD '2분이면 끝' 주유보다 빠른 1500kW 초급속 충전	오토헤럴드
[모빌리티 인사이트] 폴스타·르노 CEO 'PHEV는 가짜 전동화' 직격	오토헤럴드
[뉴스줌인] 사양 올리고 가격은 그대로… '가성비' 정조준한 아이폰 17e	IT동아
[위클리AI] 퍼플렉시티 컴퓨터 나왔다···앤스로픽, 버셉트 인수 외	IT동아
AI가 장애 혐오 표현을 찾아내고 고쳐준다면? 100명의 장애인이 평가한 결과	AI matters
병원 설문지가 대화로 바뀐다…GPT가 환자 문진표를 대신 작성하는 시대	AI matters
챗GPT가 소설을 먹고 자란다? AI 학습 데이터에 숨겨진 '픽션의 비밀'	AI matters
MWC 2026, 이통3사 AI 전면전 막 올랐다	IT동아
[기자 수첩] '1000대 계약 달성' 고객 염장 지른 볼보코리아의 '시가'	오토헤럴드
신학기 대학생을 위한 테크 축제, ‘2026 인텔®&다나와 아카데미 페스티벌’이 온다! (2)	다나와
신학기 활력을 더하는 IT 축제… ‘2026 인텔®&다나와 아카데미 페스티벌’ (2)	다나와
뇌 없는 해파리도 잠을 잔다?	과학향기
제네시스, 中 겨냥 '제트 온 휠스 기반' 플래그십 미니밴 카드 저울질	오토헤럴드
"봄 라운딩 슈퍼카로 가볼까" 골프백 4개 싣고 3초대 제로백 티샷	오토헤럴드
비싼 메모리 시대에 램버스 실패로 알아보는 AI 시대 메모리 확보 전쟁의 끝은? [PC흥망사 172] 동영상 있음	보드나라
한국 문화를 배경으로 만든 K 게임들 한 눈에 보기 동영상 있음	집마 홀릭TV
이 사랑, 캐나다에서 통역 되나요?	트래비
갤럭시 S26 울트라 반전 성능부터 스타필드 PS5 출격까지… 이번 주 IT 루머 핵심 정리 (2)	다나와
꽃보다 섬, 쑥섬에 가다	트래비
인텔의 로스트 테크놀로지, 만원짜리 3DXpoint 옵테인 메모리로 SSD비슷한 걸 만들어 봤습니다 동영상 있음	민티저
2026년에 윈엠프 켜봤습니다. 국민오디오 이거 아는사람 손 ㅋㅋㅋㅋ (3) 동영상 있음	딴트공 말방구 실험실
폭스바겐 + 포르쉐 시총 = 현대차 시총 "세상에 이런 날이 오다니!" 동영상 있음	오토기어
설치도, 복잡한 인프라도 필요 없다… 웹 브라우저 하나로 확대되는 ‘AI·코딩 교육’	IT동아
저스트핀 CTO "2인 체제로 블루미 출시···현실감 있는 대화에 집중"	IT동아
[숨신소] 상태창! ‘압긍’ 실사 인터렉티브, 재부팅된 운명	게임메카
젠지 "팬들의 성원, 퍼스트 스탠드 우승으로 보답하겠다"	게임메카
서브컬처의 성지 '일러스타 페스 10'을 빛낸 '1stPlayer + YESTON' 부스	미디어픽
'HP 3D 프린터 한 대로 드론 연 2만 대 생산'··· UAV 제조 최선단에 있는 HP (1)	IT동아
한국서 '필랑트' 출시 앞둔 르노, 4년 중기 전략 '퓨처레디' 예고 (1)	오토헤럴드
푸조, 2026년형 9X8 신규 리버리 공개 'WEC 카타르 1812km' 데뷔	오토헤럴드
집에서 시작하는 가장 향기로운 취미, '홈카페' 만들기 [모두의 취미] (2)	다나와
고정비·교통·구독·여행까지, 똑똑하게 고르는 2026 신용카드 계급도 (10)	다나와
파네시아 정명수 대표 "UA·UV링크 아우르는 인터커넥트 주권 확보할 것"	IT동아
[정보/루머] 통합 코어 아키텍처 개발에 나선 인텔 및 AMD RDNA 5 플래그십 한정 출시 가능성 등	다나와
챗GPT가 강박장애 환자를 더 아프게 만든다, '안심 로봇'의 위험한 진실	AI matters
별점만 믿다간 낭패! ChatGPT가 470만 개 리뷰를 파헤쳐 밝혀낸 '맛집의 진짜 조건'	AI matters
갤럭시 S26 시리즈, '스펙' 보다 'AI 경험' 더 앞세웠다	IT동아
“공공 AI 전환의 현실과 가능성을 논하다” 애자일 AI 정부 세미나	IT동아
16형 디스플레이로 확장된 작업 공간과 달라진 생산성, 2026년형 LG gram Pro AI (1)	다나와
시각적 인상과 질감의 차이, 소재의 본질로 완성된 2026년형 LG 그램	다나와
갤럭시 S26 울트라에 올인, 삼성전자 갤럭시 언팩 2026	보드나라
[황성진의 '고대 사상가, AI를 만나다'] 마키아벨리가 AI를 쓴다면 가장 먼저 잘라냈을 변명 세 가지	IT동아
[순정남] 30년이 지나도 답이 없는 포켓몬 미스터리 TOP 5 (2)	게임메카
디지털 네이티브를 넘어 'AI 네이티브'로··· 렛서 심규현 대표가 말하는 AX의 본질	IT동아
260km 직선도로에서 죽음의 도로까지, 더 멀리 가려는 욕망의 결과 '길'	오토헤럴드
2번째 대만 가오슝 여행을 위한 추천 명소 3	트래비
영상 제작, AI에게 대체될까? \|\| AI시대에서 살아남기, 김그륜 디자이너님 동영상 있음	조코딩 JoCoding
[르포] 네덜란드 도심 한복판에 들어선 ‘암스테르담 지커 센터’를 가다	IT동아
연희동 전기차 화재 "아이오닉5 무관" 그럼 사실은? 동영상 있음	오토기어
에디터가 직접 다녀온 대만 타이난 자유여행 추천 명소 5	트래비
'무조건 클라우드'는 옛말… 통제권 되찾는 ‘클라우드 송환’ 뜬다	IT동아
[AI 써봄] 첫 딸 육아, 챗GPT와 함께 한 1년	IT동아
[모빌리티 인사이트] 전기차 마진 압박 해법 '버려진 것'에서 찾는다	오토헤럴드
[EV 트렌드] "이래도 안 믿어" 도넛랩, 전고체 배터리 검증 영상 공개	오토헤럴드
'계란은 한 바구니에 담지 않는다'··· 메타, AMD와 6GW 인프라 계약 배경은?	IT동아
[위클리AI] 앤스로픽·구글 연달아 새 모델 출시···엔비디아·메타 다시 손잡았다	IT동아
AI가 코딩의 종언 부를까··· '어떻게' 만들까 보다 ‘무엇’을 만들지 더 중요한 시대 온다	IT동아
모티프 합류로 다시 불붙은 독자 AI 파운데이션 사업··· '4강 구도 짚어보니'	IT동아
10세대? 외전? 포켓몬 30주년 기념 신작 루머 총정리 (1)	게임메카
[겜ㅊㅊ] 출시 기다려지는, 스팀 넥스트 페스트 데모 5선	게임메카
2028년 붕괴 시나리오로 전세계 공포, AI가 완벽하게 성공할수록 경제는 무너진다	AI matters
AI 전쟁 시뮬레이션, 가장 먼저 핵 투하를 지시한 AI 모델은?	AI matters
AI가 "생각을 줄이면" 오히려 더 똑똑해진다? 토큰 예산과 LLM 추론의 역설	AI matters
[숨신소] 멘헤라 소녀와 피를 건 주사위 게임 ‘멘헤라리움’ (1)	게임메카

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI가 지도를 공부한 게 아니었다? 단어 패턴만으로 세계 지리를 꿰뚫는 충격 실험

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI가 지도를 공부한 게 아니었다? 단어 패턴만으로 세계 지리를 꿰뚫는 충격 실험

공유하기

공감/비공감