비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

AI가 지도를 공부한 게 아니었다? 단어 패턴만으로 세계 지리를 꿰뚫는 충격 실험

2026.03.06. 15:51:49
조회 수
83
9

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

내비게이션 앱도 아닌데, 지도 데이터도 없는데, AI가 "레이캬비크"라는 단어 하나만 보고 그 도시가 북쪽의 추운 곳이라는 걸 맞혔다면 믿겠는가. 플로리다 애틀랜틱 대학교(Florida Atlantic University)의 일란 바렌홀츠(Elan Barenholtz) 교수 연구팀이 2026년 3월 발표한 논문에서 10년 전 기술로 이것을 해냈다. 더 놀라운 건 최신 AI가 아니라 2013년에 만들어진 단어 통계 기술을 썼다는 점이다. 과연 AI는 세상을 '이해'하는 걸까, 아니면 글자들의 패턴을 '기억'하는 걸까.

단어가 모이면 지도가 된다

연구팀이 사용한 기술 이름은 글러브(GloVe)와 워드투벡(Word2Vec)이다. 둘 다 2013~2014년에 개발된, AI 세계에서는 꽤 오래된 기술이다. 이 기술들이 하는 일은 단순하다. "어떤 단어들이 같은 문장이나 문단에 자주 함께 등장하는가"를 숫자로 바꾸는 것이다. 예를 들어 "커피"와 "카페"는 자주 같이 나오니까 두 단어의 숫자가 비슷해지고, "커피"와 "눈보라"는 거의 같이 안 나오니까 숫자가 멀어진다. 이 숫자 덩어리를 300개 차원의 벡터(vector), 즉 방향이 있는 좌표라고 부른다.

연구팀은 이 숫자 좌표에 선형 회귀 프로브(linear regression probe)라는 탐색 도구를 붙였다. 프로브는 일종의 탐지기다. X선이 몸속을 들여다보듯이, 단어 좌표 안에 숨어 있는 정보를 꺼내 보는 장치라고 생각하면 된다. 연구팀은 전 세계 100개 도시 이름을 이 탐지기에 넣고 물었다. "이 단어 좌표 안에 위도와 경도 정보가 들어있나요?"

결과는 놀라웠다. 위도는 최대 87%, 경도도 비슷한 수준으로 맞혔다. 연평균 기온도 52%까지 예측했다. 반면 인구수, 국내총생산(GDP), 해발고도는 거의 맞히지 못했다. 이게 중요하다. 아무 정보나 다 나온 게 아니라, 특정 정보만 골라서 나온 것이다.

"파리"가 "프랑스"와 붙어다니는 이유

그렇다면 어떻게 단어 숫자에 지리 정보가 담겼을까. 연구팀은 2만 개의 영어 단어를 전부 뒤졌다. 각 단어가 86개 도시 이름과 얼마나 가까운지 계산하고, 그 거리가 실제 기온이나 위도와 얼마나 연관되는지 봤다.

답은 명쾌했다. 따뜻한 도시 이름 옆에는 "덩기(dengue, 열대 질병)", "사이클론(cyclone)", "코코넛(coconut)", "야자수(palms)"같은 단어들이 자주 붙었다. 차가운 도시 이름 옆에는 "화학자(chemist)", "물리학자(physicist)", "스키(skiing)"가 자주 등장했다. 이건 연구팀이 미리 골라서 넣은 단어들이 아니다. 2만 개 단어를 무작위로 분석했더니 저절로 이런 패턴이 나왔다.

여기서 핵심 발견이 나온다. 바로 국가 이름이었다. 연구팀은 일부러 국가 이름들을 지웠다. 글러브 좌표에서 국가 이름들이 차지하는 방향을 통째로 제거한 것이다. 그랬더니 위도 예측 정확도가 87%에서 76%로 떨어졌고, 기온 예측은 52%에서 36%로 뚝 내려갔다. 같은 수의 무작위 단어를 지웠을 때는 정확도가 거의 안 변했다. 즉, 국가 이름이 지리 정보를 전달하는 핵심 다리 역할을 하고 있었다.

이유는 일상 언어에 있다. 뉴스 기사에서 "방콕"은 늘 "태국", "열대", "아세안(ASEAN)"과 함께 나온다. "오슬로"는 "노르웨이", "피요르드(fjord)", "북유럽"과 같이 등장한다. 이런 동행이 수억 번 반복되면 단어 좌표 안에 지리적 지도가 저절로 새겨진다.

역사 인물 이름으로 시대를 추측하다

연구팀은 공간 정보에서 멈추지 않았다. 시간 정보도 실험했다. 호메로스(Homer, 기원전 800년경)부터 스티븐 호킹(Stephen Hawking, 1942년생)까지 역사적 인물 194명의 이름을 같은 방식으로 분석했다. "이 이름의 단어 좌표를 보면 이 사람이 언제 태어났는지 알 수 있을까?"라는 질문이었다.

정확도는 약 48~52%였다. 지리 정보보다는 낮지만 완전히 우연보다는 훨씬 높다. 탐지기가 고대(기원전~서기 500년), 중세(500~1400년), 근현대(1400년 이후)를 대략 구분하는 데 성공했다. "아인슈타인(Einstein)"이라는 이름 옆에는 "상대성이론", "20세기", "물리학"이 자주 붙고, "아리스토텔레스(Aristotle)"옆에는 "고대", "그리스", "철학"이 따라다닌 덕분이다.

지리 정보보다 시간 정보의 정확도가 낮은 것도 흥미롭다. 텍스트에서 공간은 명시적으로 자주 언급된다. "파리는 프랑스에 있다"는 문장은 넘쳐나지만, "나폴레옹은 1769년에 태어났다"는 문장은 상대적으로 드물다. 언어 자체가 공간에 대해 더 수다스럽다는 뜻이다.

AI 도구에는 어떤 도움이 될까

이 연구는 단순히 흥미로운 실험에 그치지 않는다. 실용적인 메시지도 담고 있다.

첫 번째는 비용과 효율이다. 요즘 챗GPT(ChatGPT)나 클로드(Claude) 같은 최신 대형 언어모델(LLM)은 수천억 개의 매개변수(parameter, AI가 학습하는 숫자 단위)를 가진다. 돌리려면 엄청난 전기와 서버가 필요하다. 하지만 이번 연구는 특정 작업에서는 300개 차원의 단순 단어 좌표만으로도 충분하다는 것을 보여줬다. 여행지 추천 앱이 도시 간 유사도를 계산하거나, 역사 문서를 시대별로 묶는 작업이라면 굳이 비싼 최신 AI를 쓸 필요가 없다는 뜻이다. 이는 전기 요금이나 서비스 비용을 크게 낮출 수 있다.

두 번째는 AI 연구 방법론의 경고다. 지금까지 많은 연구자들이 최신 AI의 내부 상태에서 지리나 시간 정보를 꺼낼 수 있다는 걸 발견하고 "AI가 세계 지도 같은 내부 모델을 만들었다"고 주장해왔다. 대표적으로 거니와 테그마크(Gurnee and Tegmark)가 2024년 라마-2(Llama-2)라는 대형 AI를 분석해 이런 주장을 펼쳤다. 바렌홀츠 교수 연구팀은 같은 방법으로 10년 전 기술을 분석해도 비슷한 결과가 나온다는 걸 보여주며 이렇게 말한다. "탐지기로 정보를 꺼낼 수 있다는 사실만으로는 AI가 진짜로 세계를 이해한다고 말할 수 없다."

냉장고 비유를 생각해보자. 냉장고에서 음식 냄새가 난다고 해서 냉장고가 요리를 이해한다고 말하진 않는다. 냄새는 그냥 음식이 거기 있었다는 흔적이다. AI에서 지리 정보가 나온다는 것도, 텍스트 원래부터 그 패턴이 있었다는 흔적일 수 있다.

세 번째는 언어 자체에 대한 새로운 시각이다. 이 연구가 진짜 놀라운 이유는 AI의 한계를 보여주는 게 아니라, 인간 언어의 풍부함을 새롭게 발견했기 때문이다. 우리가 매일 쓰는 문장들이 쌓이면 그 안에 지리, 기후, 역사가 고스란히 담긴다. 언어는 세상의 압축본이다.

FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q. 이 연구는 챗GPT 같은 AI가 세상을 이해 못 한다는 뜻인가요?

A. 꼭 그렇지는 않습니다. 이 연구는 AI가 지리나 시간 정보를 보여준다는 증거가 사실 텍스트 속에 원래부터 있던 패턴일 수 있다고 지적합니다. AI가 진짜로 세상을 이해하는지, 아니면 단어 패턴을 재현하는지는 여전히 학계에서 논의 중입니다. 다만 탐지기로 정보를 꺼낼 수 있다는 사실만으로 '진짜 이해'를 증명할 수는 없다는 것이 이 연구의 핵심입니다.

Q. 10년 된 기술로도 된다면 굳이 최신 AI를 써야 하나요?

A. 용도에 따라 다릅니다. 오래된 단어 통계 기술은 맥락을 구분하지 못합니다. '사과'가 과일인지 애플(Apple) 회사인지 모르고, 문장을 만들거나 대화를 이어가는 것도 불가능합니다. 최신 AI는 이런 복잡한 맥락 이해와 생성 능력에서 압도적으로 뛰어납니다. 단, 도시 유사도 비교나 시대 분류처럼 단순한 작업이라면 굳이 비싼 AI를 쓸 필요가 없을 수 있습니다.

Q. 이 연구 결과가 실생활에서 어떻게 도움이 되나요?

A. 여행 앱, 역사 교육 콘텐츠, 문서 자동 분류 시스템 같은 서비스를 만들 때 훨씬 저렴하고 가벼운 기술을 선택할 수 있다는 힌트를 줍니다. 또한 AI를 연구하는 분들이라면, 새로운 AI 실험 결과를 해석할 때 "이게 진짜 새로운 능력인가, 아니면 텍스트에 원래 있던 패턴인가"를 꼭 비교해봐야 한다는 교훈을 얻을 수 있습니다.

기사에 인용된 논문 원문은 arXiv에서 확인할 수 있다.

논문명: World Properties without World Models: Recovering Spatial and Temporal Structure from Co-occurrence Statistics in Static Word Embeddings

이미지 출처: AI 생성 콘텐츠

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.





AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 기획뉴스 전체 둘러보기
1/1
[정보/루머] 물 들어올 때 노 저으려는 인텔, PC 시장 도전을 멈추지 않을 퀄컴 등 (1) 다나와
AI의 무기화 시작한 美 정부, 'LLM'은 어떻게 알고리즘 전쟁의 종심이 됐나 (1) IT동아
집에서 쓰는 챗GPT가 직장보다 2배 더 효율적인 충격적 이유 AI matters
AI가 지도를 공부한 게 아니었다? 단어 패턴만으로 세계 지리를 꿰뚫는 충격 실험 AI matters
AI도 시험 도중 실수를 고친다, 기존보다 5배 빠른 학습의 비밀 AI matters
교토를 향긋하게 음미하는 방법 [이성균 기자의 M-SG] (1) 트래비
[황성진의 '고대 사상가, AI를 만나다'] 아리스토텔레스가 보면, 요즘 AI 활용은 전부 '반쪽짜리' IT동아
볼보 EX60, 세계 최초 체형 분석 ‘멀티 어댑티브 안전벨트’ 적용 오토헤럴드
'텔루라이드도 가능한 일' 혼다, 美 생산 SUV '패스포트' 일본 역수입 오토헤럴드
[EV 트렌드] '흔들리는 BYD' 中 내수 36% 급감, 경쟁 브랜드 맹추격 오토헤럴드
충전료 갑자기 50% 인상? 왜 이런 황당한 일이? 동영상 있음 오토기어
아이폰17e, M4 아이패드 에어 '가격 동결'에 속지 말 것! 살까말까 딱 정해드림 동영상 있음 주연 ZUYONI
벼랑 끝에 내 몰린 중국 전기차 "싸면 다 용서 된다?" 동영상 있음 오토기어
한국인이 잘 모르는 마카오 숨은 여행지&맛집 6 (1) 트래비
바르셀로나 근교 여행? '가우디 고향' 추천! 트래비
스팀 노출 증가 위한 인디 개발자용 홍보 전략 모음 게임메카
[순정남] 게이머들을 낚은 성우 라인업 트릭 TOP 5 게임메카
AI가 쓴 코드, 누가 만들었는지 밝혀낸다…챗GPT vs 클로드 판별 성공 (1) AI matters
말만 하면 AI가 생각을 정리해주는 시대, '오럴리티'가 바꾸는 사고의 방식 AI matters
파네시아, SKT AI DC·오픈칩 등 국내외 전략적 협업 통해 글로벌 시장에 '발돋움' IT동아
이 시간 HOT 댓글!
1/4