
Artificial Intelligence Index Report 2025
142배 작아진 모델로 동일한 성능, AI 비용 280배 하락
인공지능 모델이 크기는 작아지면서도 성능은 비약적으로 향상되고 있다. 스탠퍼드 대학교의 HAI(Stanford Institute for Human-Centered Artificial Intelligence)가 발표한 '2025 AI 인덱스 보고서'에 따르면, AI 모델의 소형화와 함께 비용 효율성이 크게 개선되고 있다. 2022년에는 대규모 언어 이해(MMLU) 벤치마크에서 60% 이상의 점수를 기록하기 위해서는 구글의 PaLM과 같이 5,400억 개의 매개변수를 가진 대형 모델이 필요했다. 그러나 불과 2년 만에 마이크로소프트의 Phi-3-mini는 단 38억 개의 매개변수로 동일한 성능을 달성했다. 이는 매개변수 기준으로 142배나 작아진 수치로, AI 모델 최적화가 빠르게 진행되고 있음을 보여주는 증거다.
추론 비용 측면에서도 놀라운 변화가 일어나고 있다. GPT-3.5와 동등한 성능(MMLU에서 64.8% 정확도)을 내는 AI 모델의 비용이 2022년 11월 백만 토큰당 20달러에서 2024년 10월에는 구글의 Gemini-1.5-Flash-8B 모델이 백만 토큰당 0.07달러로 18개월 만에 280배 이상 감소했다. 전체적으로 AI 추론 비용은 작업에 따라 연간 9배에서 900배까지 하락하고 있어 AI 기술의 경제성이 급격히 개선되고 있음을 알 수 있다.

미국과 중국의 AI 격차, MMLU·HumanEval에서 동등 수준으로 좁혀져
2024년 AI 시장에서 미국은 여전히 선두 자리를 유지하고 있지만, 중국이 빠르게 추격하고 있다. AI 인덱스 보고서 2025에 따르면, 2024년 미국 기반 기관들은 40개의 주목할 만한 AI 모델을 출시한 반면, 중국은 15개, 유럽은 3개를 발표했다. 특히 눈여겨볼 점은 중국 모델들의 품질이 급격히 향상되고 있다는 사실이다. MMLU와 HumanEval과 같은 주요 벤치마크에서 2023년에는 두 자릿수 성능 차이를 보였던 미국과 중국의 격차가 2024년에는 거의 동등한 수준으로 좁혀졌다.
LMSYS 챗봇 아레나에서도 미국과 중국 모델 간 성능 격차가 점점 좁아지고 있으며, 2025년 1월 기준으로 미국 모델은 1,385점, 중국 모델은 1,322점을 기록했다. 중국은 AI 학술 출판물과 특허 출원 분야에서도 계속해서 선두를 유지하고 있다.
그럼에도 불구하고 미국의 AI 투자 규모는 여전히 압도적이다. 2024년 미국 민간 AI 투자액은 1,091억 달러로, 중국의 93억 달러보다 12배, 영국의 45억 달러보다 24배 높은 수준을 기록했다. 특히 생성형 AI 투자에서는 미국이 유럽연합과 영국의 총합보다 255억 달러 더 많이 투자했는데, 이는 2023년의 211억 달러 격차보다 더 벌어진 수치다. 한편 중동, 라틴 아메리카, 동남아시아에서도 주목할 만한 모델 출시가 이루어지며 AI 개발이 점점 글로벌화되고 있다.

벤치마크 점수 1년 만에 최대 67.3% 상승, AI 의료기기 승인 건수 223개로 급증
AI 시스템의 성능은 지속적으로 가파르게 향상되고 있다. 2023년 연구자들이 고급 AI 시스템의 한계를 시험하기 위해 도입한 벤치마크들에서 불과 1년 만에 성능이 크게 향상되었다. MMMU에서는 18.8 퍼센트 포인트, GPQA에서는 48.9 퍼센트 포인트, SWE-bench에서는 67.3 퍼센트 포인트의 점수 상승을 보였다. 또한 AI 시스템은 고품질 비디오 생성에서도 큰 진전을 이루었으며, 제한된 시간 내 프로그래밍 작업에서는 언어 모델 에이전트가 인간의 성능을 능가하는 사례도 나타났다.
AI는 의료에서 교통까지 일상생활 전반에 빠르게 침투하고 있다. 2023년 미국 식품의약국(FDA)은 223개의 AI 기반 의료 기기를 승인했는데, 이는 2015년 6개에서 크게 증가한 수치다. 1995년 FDA가 첫 AI 기반 의료 기기를 승인한 이후 2015년까지는 단 6개의 기기만 승인되었으나, 이후 급격히 증가하여 2023년에는 연간 승인 건수가 223개로 폭증했다. 자율주행 분야에서도 웨이모(Waymo)는 미국에서 가장 큰 자율주행 운영사 중 하나로 성장하여 매주 15만 건 이상의 자율주행 서비스를 제공하고 있으며, 바이두의 저렴한 아폴로 고(Apollo Go) 로보택시 서비스는 중국 전역의 여러 도시에서 운영되고 있다.

기업의 생성형 AI 도입률 1년 만에 33%에서 71%로 두 배 이상 증가
기업들의 AI 사용이 가속화되고 있다. 2024년 맥킨지 서베이에 따르면 조직의 78%가 최소 한 가지 이상의 기능에서 AI를 사용한다고 보고했는데, 이는 전년도의 55%에서 크게 증가한 수치다. 특히 생성형 AI를 적어도 한 가지 비즈니스 기능에서 사용한다고 보고한 응답자 수는 2023년 33%에서 2024년 71%로 두 배 이상 증가했다. 이는 AI가 더 이상 실험적 기술이 아니라 비즈니스 가치를 창출하는 핵심 도구로 자리잡고 있음을 보여준다.
민간 AI 투자도 계속해서 증가하고 있다. 미국은 2024년 민간 AI 투자 규모에서 1,091억 달러를 기록했으며, 이는 중국의 93억 달러보다 12배, 영국의 45억 달러보다 24배 높은 수준이다. 유럽 전체의 AI 투자액도 꾸준히 증가하여 2024년에는 194.2억 달러를 기록했다. 동시에 점점 더 많은 연구에서 AI가 생산성을 향상시키고, 대부분의 경우 인력 전반의 기술 격차를 줄이는 데 도움이 된다는 것이 확인되고 있다.

AI 관련 사고 56.4% 증가한 233건, 주 정부 AI 법률 131개로 두 배 이상 늘어
AI 관련 사고가 급격히 증가하고 있다. AI 인시던트 데이터베이스에 따르면, AI 관련 사고 건수가 2024년에 233건으로 증가해 기록적인 수치를 기록했으며, 이는 2023년 대비 56.4% 증가한 것이다. 보고된 사고 중에는 딥페이크 음란물과 청소년 자살에 연루된 챗봇 사례 등이 포함되었다. 이 데이터베이스가 모든 사례를 포괄하지는 않지만, 문제적 AI 사례가 급격히 증가하고 있음을 분명히 보여준다.
이에 대응하여 정부들은 규제 마련에 속도를 내고 있다. 2024년에는 OECD, EU, UN, 아프리카 연합을 포함한 국제기구들이 투명성, 신뢰성 및 기타 핵심 책임 있는 AI 원칙에 중점을 둔 프레임워크를 발표하며 AI 거버넌스에 대한 글로벌 협력이 강화되었다. 미국에서는 연방 정부 수준의 진전은 더디지만, 주 차원의 AI 관련 입법이 급증하고 있다. 2016년에는 주 차원의 AI 관련 법률이 단 1개에 불과했지만, 2023년에는 49개로 증가했고, 지난 한 해 동안에만 그 수가 131개로 두 배 이상 늘어났다. 특히 캘리포니아주가 42개의 AI 관련 법률을 제정해 가장 앞서고 있다.
아시아 국가들의 AI 낙관론 최대 83%, 서구권 국가들보다 두 배 이상 높아
글로벌 AI 낙관론은 상승하고 있지만, 지역 간 깊은 격차는 여전히 존재한다. 중국(83%), 인도네시아(80%), 태국(77%)과 같은 아시아 국가에서는 다수가 AI 제품과 서비스가 해롭기보다 유익하다고 생각한다. 반면, 캐나다(40%), 미국(39%), 네덜란드(36%)와 같은 서구 국가들에서는 낙관론이 훨씬 낮게 나타난다.
FAQ
Q: 소형 AI 모델의 성능이 급격히 향상되는 이유는 무엇인가요?
A: 소형 AI 모델의 성능 향상은 모델 아키텍처 최적화, 효율적인 학습 방법 개발, 양질의 데이터셋 구축 등 여러 요인에 기인합니다. 2022년에는 60% 이상의 MMLU 점수를 얻기 위해 540억 개의 매개변수가 필요했지만, 2024년에는 불과 38억 개 매개변수로 동일한 성능을 달성했습니다. 이러한 효율성 향상은 AI 기술을 더 작은 기기에서도 사용할 수 있게 하고, 비용과 에너지 소비를 크게 줄입니다.
Q: 미국과 중국의 AI 경쟁 상황은 어떻게 되나요?
A: 미국은 여전히 AI 모델 개발 수량과 투자 규모에서 앞서고 있지만, 중국의 AI 기술이 빠르게 따라잡고 있습니다. 2024년 미국은 40개의 주목할 만한 AI 모델을 출시한 반면 중국은 15개를 선보였으며, 주요 벤치마크에서 성능 차이가 2023년 두 자릿수에서 2024년에는 거의 동등한 수준으로 좁혀졌습니다. 투자 측면에서는 미국이 1,091억 달러로 중국의 93억 달러보다 12배 많지만, 중국은 AI 학술 출판물과 특허 출원에서 계속 선두를 유지하고 있습니다.
Q: AI 관련 문제와 규제는 어떻게 변화하고 있나요?
A: AI 관련 사고는 2024년 233건으로 전년 대비 56.4% 증가했습니다. 이에 대응해 정부와 국제기구들의 규제 노력이 확대되고 있으며, 특히 미국에서는 연방 수준보다 주 정부 차원의 규제가 활발해져 2023년 49개에서 2024년 131개로 AI 관련 법률이 급증했습니다. 동시에 OECD, EU, UN 등 국제기구들은 투명성과 신뢰성에 초점을 맞춘 프레임워크를 개발하고 있습니다. 이러한 규제는 AI 기술의 안전하고 책임감 있는 발전을 보장하기 위한 노력의 일환입니다.
해당 기사에서 인용한 리포트의 원문은 링크에서 확인할 수 있다.
이미지 출처: HAI
기사는 클로드와 챗GPT를 활용해 작성되었습니다.
AI Matters 뉴스레터 구독하기