[출처 : LATAM 홈페이지]
칠레를 중심으로 한 라틴아메리카 국가들이 협력해 개발 중인 인공지능 언어 모델 ‘Latam-GPT’가 오는 2025년 중반 대중에 공개된다. 이 모델은 라틴아메리카와 카리브해 지역의 언어적 다양성과 문화를 반영한 최초의 대형 AI 언어 모델(LLM)로, 기술 주권과 포용성 측면에서 의미 있는 이정표로 평가받고 있다.
Latam-GPT는 칠레 과학·기술·지식·혁신부(Ministerio CTCI)와 국가 인공지능센터(CENIA)가 주도하고 있으며, 아르헨티나, 콜롬비아, 멕시코, 우루과이, 페루, 에콰도르 등 12개국 이상의 30여 개 기관 및 60명 이상의 전문가들이 참여하고 있다.
[출처 : LATAM 홈페이지]
이 프로젝트는 오픈소스로 개발되어 누구나 접근하고 개선할 수 있도록 설계되었으며, ChatGPT 같은 폐쇄형 모델과 달리 지역 내 다양한 기관과 개인에게 활용 기회를 제공할 예정이다.
이 모델은 미국 오픈AI의 ‘ChatGPT 3.5’ 수준에 해당하는 550억 개의 매개변수(parameter)를 갖추며, 3조 개 이상의 토큰화된 데이터를 기반으로 학습된다. 수집된 데이터는 약 8테라바이트(TB) 규모로, 이는 수백만 권의 책에 해당하는 방대한 분량이다.
이 데이터는 칠레 북부의 타라파카대학교 슈퍼컴퓨팅센터에서 관리되며, 해당 대학은 GPU 기반의 슈퍼컴퓨터 구축에 500만 달러를 투자해 AI 인프라 확충에 앞장서고 있다.
[출처 : 칠레 과학기술지식혁신부 페이스북]
Latam-GPT의 기반 기술은 Meta의 오픈소스 모델인 ‘Llama 3’에 있으며, 칠레의 온프레미스 서버와 클라우드 인프라를 결합한 지역 분산형 컴퓨팅 네트워크를 통해 학습이 진행되고 있다. 주요 재정 지원은 CENIA 자체 예산 외에도 안데스개발은행(CAF)과 아마존웹서비스(AWS) 등에서 이루어졌다.
프로젝트의 주요 목표 중 하나는 글로벌 AI 모델들이 간과해온 라틴아메리카 고유의 언어적 미묘함과 문화적 맥락을 포착하는 것이다. 특히 라파누이어(Rapa Nui) 등 토착어 보존을 위한 번역기가 이미 개발되었으며, 향후 가상 공공 서비스 비서나 맞춤형 교육 시스템 등에 활용될 예정이다.
[아이센 에체베리, 출처 : copano.news]
과학부 장관 아이센 에체베리(Aisén Etcheverry)는 “우리가 말하는 AI는 단순한 기술이 아니라, 우리 정체성과 세계관을 반영하는 도구여야 한다”며 “Latam-GPT는 학교, 병원, 공공 행정 전반에 적용되어 기술 민주화를 이끌 수 있는 잠재력을 지녔다”고 강조했다.
또한 그녀는 이 모델이 칠레 정부의 디지털화에도 핵심 역할을 할 것이라며 “공공기관 및 지자체와 협력해 시민에게 실질적인 혜택을 주는 AI 솔루션을 개발하겠다”고 밝혔다.
Latam-GPT는 상업적 목적보다는 지역 문제 해결을 위한 핵심 기술로 설계되었으며, 챗봇, 번역기, 텍스트 요약기 등 다양한 응용 서비스의 기반 모델로 활용될 전망이다. 더불어 칠레 정부는 스타트업 및 기술기업이 Latam-GPT를 활용해 다양한 인공지능 서비스를 개발할 수 있도록 데이터센터 설치와 컴퓨팅 인프라 확장 계획도 추진 중이다.
CENIA 소장 알바로 소토(Álvaro Soto)는 “AI 기술이 사회에 어떤 영향을 미칠지를 스스로 결정할 수 있는 능력, 즉 기술적 독립성을 키우는 것이 중요하다”며 “Latam-GPT는 이를 위한 첫걸음이며, 단일 국가가 아닌 지역 전체의 집단적 노력이 필요하다”고 말했다.
Latam-GPT는 향후 더 많은 원주민 언어 확장과 지역별 특화 기능을 갖춘 모델로 진화할 것으로 기대되며, 라틴아메리카가 AI 기술의 수용자에서 생산자로 도약하는 데 중요한 발판이 될 것으로 보인다.
글 / 홍정민 news@cowave.kr
(c) 비교하고 잘 사는, 다나와 www.danawa.com