챗GPT(ChatGPT)와 클로드(Claude) 같은 AI 대화 서비스가 전 세계로 퍼져나가고 있지만, 정작 혜택을 누리는 언어는 극소수에 불과하다. 케임브리지 대학교(University of Cambridge) 연구팀이 2026년 2월 발표한 논문에 따르면, AI 언어 기술의 자원은 소수의 언어에 극단적으로 집중되어 있으며, 이 격차는 시간이 지날수록 좁혀지기는커녕 오히려 기하급수적으로 벌어지고 있다. 전 세계 6,003개를 전수조사 한 결과 90% 이상이 AI 혜택에서 사실상 배제된 현실, 그 구체적인 민낯을 들여다봤다.
영어 AI 모델, 연간 5만 개씩 늘어나는 동안 아프리카 언어는 연평균 4개
연구팀은 AI 모델과 데이터셋을 공유하는 세계 최대 플랫폼 허깅페이스(Hugging Face)의 2020년부터 2024년까지 매년 말 시점의 5년치 데이터를 분석했다. 그 결과는 충격적이었다. AI 모델과 데이터의 분포는 이른바 '지프 법칙(Zipf's Law)'을 따르는데, 이는 상위 소수가 전체 자원의 대부분을 독점하는 현상을 수학적으로 표현한 것이다. 쉽게 말해, 1등 언어는 2등보다 압도적으로 많은 자원을 가져가고, 하위권 언어들은 사실상 존재하지 않는 수준에 머문다는 뜻이다. 무엇보다 현재 AI 자원의 쏠림 현상은 이 일반적인 불균형 법칙인 '지프 법칙'의 예측 범위를 훨씬 뛰어넘는 유례없는 수준이다.
특히 영어는 이 법칙에서도 예외적인 '극단적 이상치'로 분류됐다. 영어 AI 모델은 매년 최대 5만 개씩 새로 등장한 반면, 콩고 스와힐리어(Congo Swahili), 쿠안야마어(Kuanyama), 에티오피아의 월라이타어(Wolaytta) 같은 언어들은 연평균 고작 4.15개의 모델만 추가됐다. 연구팀은 이 현상에 '지프화(Zipfianisation)'라는 이름을 붙였다. AI가 발전할수록 풍족한 언어는 더 풍족해지고, 소외된 언어는 더 깊이 소외되는 '승자독식' 구조가 전례 없는 속도로 굳어지고 있다는 경고다.
아프리카 언어는 3,100만 명이 써도 AI 모델 10개, 브르타뉴어는 20만 명이 쓰는데도 동일
AI 자원의 불평등은 단순한 선진국·개발도상국 구도로 설명되지 않는다. 연구팀은 사용자 수와 AI 모델 수의 관계를 분석했을 때, 지역과 역사적 배경이 훨씬 강력한 영향을 미친다는 사실을 발견했다.
나이지리아·카메룬 등에서 약 3,100만 명이 사용하는 이그보어(Igbo)는 AI 모델이 10개에 불과하다. 그런데 프랑스 서부 지방에서 약 20만 명이 사용하는 브르타뉴어(Breton)도 정확히 같은 수의 모델을 보유하고 있다. 인구 대비로 보면 이그보어 화자들이 받는 AI 혜택은 브르타뉴어 화자들의 수백분의 일에 불과한 셈이다. 비슷한 사례로, 약 8,500만 명이 쓰는 나이지리아 피진어(Nigerian Pidgin)는 모델 10개, 약 1,300만 명이 사용하는 치타고니아어(Chittagonian)는 단 1개에 그쳤다.
반대로 모델이 과잉 공급된 언어들은 대부분 유럽 언어다. 핀란드의 경우, 사용자 수가 극히 적은 소수 언어들도 전 세계 평균을 훨씬 웃도는 모델 수를 자랑한다. 심지어 이미 사멸한 언어인 라틴어(Latin), 고대 그리스어(Ancient Greek), 고대 영어(Old English)도 상당수의 모델을 갖고 있다. 학문적 위상과 저작권 제약 없는 텍스트 데이터가 풍부하기 때문인데, 연구팀은 이를 "현실의 필요와 동떨어진 자원 배분"이라고 비판했다.
더 놀라운 역설도 있다. 미국과 호주는 영어 이외의 자국 내 언어에 대한 AI 모델 커버리지가 나이지리아보다 오히려 낮다. 나이지리아의 경우 자국 언어의 14.7%가 AI 모델을 하나 이상 보유하고 있는 반면, 미국은 14%, 호주는 6.8%에 그쳤다. 특히 세계 최첨단 기술 중심지인 미국 캘리포니아(California) 주에서 오히려 소외된 언어가 가장 많다는 사실은 이 문제가 단순한 개발 격차가 아님을 보여준다.
AI는 휴대폰·PC와 달랐다: 폭발적 확산 이후 불평등이 굳어지는 구조
새로운 기술이 세상에 퍼져나가는 방식은 보통 S자 곡선을 그린다. 처음엔 천천히 퍼지다가 어느 순간 급격히 확산되고, 결국 안정 단계에 접어드는 패턴이다. 휴대폰, 개인 컴퓨터, 전기차 모두 이 경로를 따랐다.
그런데 AI 언어 모델은 달랐다. 연구팀이 분석한 결과, AI 언어 모델은 초기부터 전례 없는 속도로 폭발적으로 확산됐다. 가장 결정적인 차이는 확산의 '동력'이다. 휴대폰이나 컴퓨터는 각 지역 공동체가 필요를 느끼고 서서히 채택하는 방식으로 퍼졌다. 반면 AI 언어 모델은 기업들이 수백 개 언어를 한꺼번에 학습시키는 방식으로 배포되기 때문에, 겉으로는 많은 언어를 지원하는 것처럼 보이지만 실제 성능 차이는 막대하다.
연구팀은 이를 "하향식(top-down) 산업적 우선순위와 글로벌 웹 데이터 가용성이 주도하는 확산"이라고 설명한다. AI 모델의 확산이 둔화되는 시점이 오면, 이는 언어 간 격차가 해소되는 신호가 아니라 오히려 기술 지배력이 굳어지는 '잠금(lock-in)' 현상을 의미한다. 처음에 영어 등 자원이 풍부한 언어 중심으로 빠르게 성장한 AI가 이후 그 구조를 더욱 공고히 한다는 것이다. 결국 AI가 모든 사람에게 평등한 범용 기술이 될 것이라는 기대는, 적어도 언어 측면에서는 아직 현실과 거리가 멀다.
EQUATE: "AI 준비가 된 언어"를 찾아내는 세계 최초의 언어 AI 준비 지수
이 문제를 해결하기 위해 연구팀은 이퀘이트(EQUATE, Language AI Readiness Index)라는 오픈소스 지수를 개발했다. 전 세계 6,003개 언어를 대상으로 AI 자원 현황, 디지털 인프라, 사회경제적 조건 등 25가지 지표를 종합해 언어별 'AI 준비도'를 수치로 나타낸 세계 최초의 도구다.
이 지수의 핵심 발견은 "기술적으로 준비가 된 언어가 생각보다 훨씬 많다"는 것이다. 무려 1,000개 이상의 언어가 상당한 수준의 데이터를 보유하고 있으며, 그 중 597개 언어(주로 아프리카와 아시아 소재)는 AI 모델이 3개 미만임에도 AI 개발을 시작할 준비가 충분히 갖춰져 있다. 약 8,000만 명이 사용하는 하카 중국어(Hakka Chinese)나 모로코 인구의 90% 이상이 사용하는 다리자어(Darija, 모로코 아랍어) 등이 대표적인 사례다.
반면 에스페란토(Esperanto)처럼 사실상 원어민이 없는 인공 언어가 AI 커뮤니티에서 불균형적으로 많은 관심을 받는 현실도 드러났다. 이는 연구 편의성과 깔끔한 데이터 가용성이 실제 사용자 필요보다 우선시되는 구조적 문제를 보여준다. EQUATE는 equate-index.ai에서 누구나 무료로 활용할 수 있으며, 연구자와 정책 입안자, 투자자들이 실질적으로 도움이 필요한 언어 공동체를 찾아 자원을 집중할 수 있도록 설계됐다.
AI 매터스 시사점: "다국어 지원"이라는 말을 곧이곧대로 믿지 마라
이 연구가 던지는 가장 중요한 메시지는 'AI가 다국어를 지원한다'는 홍보 문구 뒤에 숨겨진 실상이다. 챗GPT를 비롯한 주요 AI 서비스들이 100개 이상의 언어를 지원한다고 밝히지만, 언어마다 실제 성능 차이는 하늘과 땅 차이다. 연구팀이 '표현 세탁(representation washing)'이라고 부르는 이 현상은 실제로는 불평등을 심화시키면서 통계상으로만 커버리지가 넓어 보이게 만든다.
한국어의 경우, 전 세계 언어 순위에서 비교적 상위에 위치해 있어 AI 자원 측면에서 상대적으로 양호한 편이다. 그러나 이 연구는 국가 단위가 아닌 언어 공동체 단위로 문제를 바라봐야 한다고 강조한다. 한국 내에서도 수어(手語) 등 소수 언어 공동체는 여전히 AI 혜택에서 소외될 수 있다. 글로벌 AI 서비스를 선택하거나 활용할 때, 해당 서비스가 특정 언어에서 실제로 어느 수준의 성능을 제공하는지 비판적으로 살펴보는 시각이 필요하다. AI의 '포용성'은 지원 언어 수가 아니라, 각 언어에서의 실질적인 품질로 평가해야 한다.
FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)
Q. 챗GPT나 클로드 같은 AI가 다국어를 지원한다고 하는데, 왜 언어 불평등이 문제가 되나요? A. AI가 언어를 '지원'한다고 해서 모든 언어에서 동일한 품질을 보장하지는 않습니다. 학습에 사용된 데이터 양이 언어마다 극단적으로 다르기 때문에, 영어로 물어볼 때와 아프리카 소수 언어로 물어볼 때 답변의 정확성과 유용함은 크게 차이 납니다. 이 연구는 그 격차가 시간이 지날수록 더 벌어지고 있다는 사실을 수치로 증명했습니다.
Q. 한국어는 AI에서 어느 정도 수준의 지원을 받고 있나요? A. 한국어는 전 세계 언어 중 AI 모델 보유 수 기준으로 상위권에 속합니다. 허깅페이스(Hugging Face) 기준으로 영어, 중국어, 프랑스어, 스페인어, 일본어 다음으로 비교적 많은 모델을 보유하고 있어 '중상위 자원 언어'로 분류됩니다. 다만 영어와의 격차는 여전히 상당하며, 특수 분야나 방언 수준에서는 지원이 부족할 수 있습니다.
Q. EQUATE 지수는 어디서 확인할 수 있고, 어떻게 활용할 수 있나요? A. EQUATE 지수는 equate-index.ai에서 무료로 이용할 수 있습니다. 원하는 언어나 국가를 선택해 AI 준비도 점수를 확인하고, 다른 언어와 비교할 수 있습니다. 연구자나 개발자라면 어떤 언어에 AI 개발 투자가 가장 효과적일지 판단하는 데 활용할 수 있고, 일반 사용자도 자신의 언어가 AI 생태계에서 어느 위치에 있는지 파악하는 데 도움이 됩니다.
기사에 인용된 리포트 원문은 arXiv에서 확인할 수 있다.
리포트명: Artificial Intelligence is Creating a New Global Linguistic Hierarchy
이미지 출처: 이디오그램 생성
해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.
AI Matters 뉴스레터 구독하기




[
3