로그인하세요
알림
설정
레프트패널 닫기
관심
최근본
마이페이지
출석체크
카테고리
    서비스 바로가기
    • 자동차
    • 인기 서비스조립PC
    • PC견적
    • PC26
    • 신규 서비스LIVE쇼핑
    • 커뮤니티
    • 이벤트
    • CM추천/문의
    • 오늘의 특가
    앱 서비스
    • 자동차
    • PC견적
    • 장터
    인기 쇼핑몰
    • 지마켓
    • 옥션
    • 11번가
    • 롯데아이몰
    • 쿠팡
    • 롯데닷컴(롯데온)
    • 신세계몰
    • 현대Hmall
    • CJ 온스타일
    • GS샵
    • 하이마트
    • 엘롯데
    • 이마트몰
    • 홈플러스
    • NS몰
    • SK스토아
    • KT알파 쇼핑
    • 전자랜드
    • 무신사
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) (우) 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    사용법 보기
    MY쇼핑이란? 자주 쓰는 쇼핑몰을 연결하면 쇼핑몰 주문내역을 한 번에 확인할 수 있습니다. 쇼핑몰 계정은 고객님의 핸드폰에만 저장되어 안전합니다.
    편리한 구매내역 확인. 다양한 쇼핑몰의 주문내역을 한 곳에서 확인해보세요.
    가격비교와 최저가 쇼핑을 한 번에. 자주 구매하는 상품은 가격비교를 통해 저렴하게 구매하세요.
    보안은 필수! 쉽고 편한 가치 쇼핑. 쇼핑몰 계정은 고객님의 핸드폰에만 암호화 저장되어 안전합니다. 쇼핑몰 연결
    다나와 홈

    커뮤니티 DPG

    일반뉴스

    • 게시판
    • 상품포럼
    • 뉴스
    • 동영상
    • 커뮤니티 공지사항
      소비자사용기
    • 특가몰
      자유게시판
    • 이달의 이벤트
      유머게시판
    • 당첨자발표게시판
      댕냥이게시판
    • 포인트 마켓
      Q&A게시판
    • 다나와 래플
      상품의견
    • 모두의 경매
      체험단
    • 오늘도 출석체크
      엄근진게시판
    • 입소문쇼핑
      쇼핑몰후기
    • 메인가자
      A/S후기
    • 당첨후기
    • 컴퓨터
      AI
    • 푸드
      취미
    • 최신뉴스
      일반뉴스
    • 기획뉴스
      신상품뉴스
    • 쇼핑뉴스
      테크팁
    • 다나와리포터
      구매가이드
    • 전문가리뷰
      인기순위가이드
    • 벤치마크
      차트뉴스
    • 가격동향
    • 고나고
      공구왕황부장
    • 노써치
      도레
    • 딴트공 말방구 실험실
      라이브렉스
    • 레고매니아
      맛상무
    • 모터피디
      무적풍화륜
    • 민티저
      보드나라
    • 뻘짓연구소
      여행매거진 트래비TV
    • 오토기어
      조코딩 JoCoding
    • 인프제 INFJ
      주연 ZUYONI
    • 진블로그
      집마 홀릭TV
    • 톡써니
      포마: 탈 것을 리뷰하는 남자
    • 쿨엔조이
      훅간다TV
    • AI 매터스
      Allthatboots TV
    • DmonkTV
      Hakbong Kwon
    • Motorgraph
      PC SNAP
    • Producer dk
      THE EDIT
    • UnderKG
      다나와 공식채널
    • 답나와
      리뷰나와
    • 샵다나와 조립갤러리
      직장인 다나왕
    >
    이전 글
    다음 글
    AI matters

    "폴란드어 1위, 영어 6위, 한국어 22위"… AI 언어 이해력 테스트 결과 충격

    2025.11.07. 11:00:57
    읽음302

    메릴랜드 대학교와 UMass Amherst 연구진이 26개 언어로 대형 언어 모델의 긴 맥락 처리 능력을 평가한 원룰러(OneRuler) 벤치마크를 공개했다. 해당 연구 논문에 따르면, 한국어는 26개 언어 중 22위로 하위권에 머물렀으며, 맥락 길이가 늘어날수록 성능 저하가 더욱 심각해지는 것으로 나타났다. 폴란드어가 1위를 차지한 가운데, 영어조차 6위에 그쳤다는 점에서 언어별 성능 격차가 예상을 뛰어넘는다.

    한국어 성능 22위... 폴란드어는 1위

    연구진이 6만 4천~12만 8천 토큰 길이의 긴 맥락 과제를 평가한 결과, 한국어는 26개 언어 중 22위를 기록했다. 원룰러 벤치마크의 니들 인 헤이스택(NIAH) 과제 평가에서 한국어는 중국어, 타밀어, 스와힐리어, 세소토어와 함께 하위권에 속했다. 흥미롭게도 폴란드어가 평균 정확도 88%로 1위를 차지했고, 영어는 83.9%로 6위에 머물렀다. 중국어는 62.1%로 하위 4위를 기록했다. 대부분의 AI 모델이 영어와 중국어 데이터로 주로 학습된다는 점을 고려하면 이는 매우 의외의 결과다. 상위 10개 언어는 대부분 슬라브어, 로망스어, 게르만어 계통으로 위키피디아 문서 수가 많고 라틴 문자를 사용하는 언어들이었다.


    맥락 8K→128K로 늘면 언어 격차 3배 확대

    맥락 길이가 8천 토큰일 때 상위 5개 언어와 하위 5개 언어 간 정확도 차이는 11%에 불과했다. 그러나 맥락이 12만 8천 토큰으로 늘어나자 이 격차는 34%로 세 배 이상 확대됐다. 한국어는 위키피디아 문서 수 기준으로 약 70만 개를 보유해 공식적으로는 저자원 언어로 분류되지 않지만, 실제 평가에서는 하위권에 머물렀다. 논문에서 저자원 언어로 정의한 힌디어, 세소토어, 스와힐리어, 타밀어는 모두 하위 6위 안에 포함됐으며, 짧은 맥락에서도 어려움을 겪었고 긴 맥락에서는 성능 저하가 더욱 두드러졌다. 연구진은 이러한 현상이 긴 맥락 확장 학습 데이터에서 비영어권 언어가 부족하기 때문으로 추정한다. 제미나이 1.5 플래시(Gemini 1.5 Flash)와 큐엔 2.5 72B(Qwen 2.5 72B)만이 12만 8천 토큰에서도 비교적 우수한 성능을 보였다.

    한국어 지시문 사용하면 성능 20% 하락

    연구진은 지시문과 맥락의 언어가 다른 교차 언어 시나리오를 영어, 폴란드어, 한국어 3개 언어로 테스트했다. 영어 맥락에 한국어 지시문을 사용하면 6만 4천 토큰 기준 평균 정확도가 91%에서 71%로 20% 하락했다. 반대로 한국어 맥락에 영어 지시문을 사용하면 12만 8천 토큰 기준 정확도가 61%에서 77%로 향상됐다. 폴란드어 지시문을 사용했을 때도 유사하게 향상됐다. 이는 지시 언어의 선택이 전체 성능에 최대 20%의 차이를 만들 수 있음을 보여준다. 현재로서는 한국어 지시문보다 영어 지시문을 사용하는 것이 더 나은 결과를 제공할 수 있다.

    '답이 없다' 선택지만 추가해도 o3-미니 성능 32% 급락

    연구진은 기존 니들 인 헤이스택(NIAH) 과제에 '답이 존재하지 않을 수 있음'이라는 선택지를 추가했다. 이 간단한 변경만으로 o3-미니-하이(o3-mini-high) 모델의 경우 영어 기준 12만 8천 토큰에서 정확도가 32% 하락했다. 모든 모델이 답이 실제로 존재함에도 불구하고 '없음'으로 잘못 응답하는 경우가 빈번했다. 특히 o3-미니-하이는 다른 모델들에 비해 '없음' 오답을 훨씬 더 많이 생성했다. 제미나이 1.5 플래시도 일부 고자원 언어에서 상당한 수의 '없음' 오류를 보였다. 중국어에 특화된 큐엔(Qwen) 모델도 중국어 단일 NIAH 과제에서 다수의 '없음' 오류를 생성했다.

    단어 빈도 집계는 모든 모델이 실패

    단어 빈도 추출(Common Word Extraction, CWE) 과제에서는 모든 모델이 고전했다. 가장 빈번한 단어 10개를 찾는 쉬운 버전에서 영어 평균 정확도는 31.5%에 불과했다. 빈도 차이를 줄인 어려운 버전에서는 모든 모델이 1% 미만의 정확도를 기록했다. 라마 3.3 70B(Llama 3.3 70B), 큐엔 2.5 72B, 제미나이 1.5 플래시 세 모델만이 8천 토큰에서 80% 이상의 성능을 달성했지만, 맥락 길이가 늘어나면서 급격히 하락했다. o3-미니-하이와 딥시크-R1(Deepseek-R1)은 이 과제에서 설정된 최대 출력 토큰 한도를 초과하는 경우가 빈번했으며, 틀린 답변을 생성할 때 정답보다 훨씬 더 많은 추론 토큰을 사용했다.

    다국어 AI의 한계

    이번 연구는 현재 대형 언어 모델들이 다국어, 특히 비영어권 언어의 긴 맥락 처리에서 상당한 한계를 가지고 있음을 보여준다. 한국어를 포함한 많은 언어가 짧은 맥락에서는 비교적 괜찮은 성능을 보이지만, 실제 업무에서 자주 필요한 긴 문서 처리에서는 크게 뒤처진다. 연구진은 원룰러 벤치마크 공개를 통해 다국어 및 교차 언어 긴 맥락 학습 파이프라인 개선 연구가 활성화되기를 기대한다고 밝혔다.

    FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

    Q. 한국어가 이렇게 낮은 성능을 보이는 이유는 무엇인가요?

    A. 연구진은 긴 맥락 확장 학습 데이터의 부족을 주요 원인으로 지목했습니다. 대부분의 AI 모델은 영어와 중국어를 중심으로 학습되며, 한국어는 위키피디아 문서 수가 약 70만 개로 중간 수준이지만 긴 맥락 학습에는 충분한 데이터가 제공되지 않은 것으로 보입니다. 긴 맥락 처리 능력이 언어 간에 쉽게 전이되지 않는다는 점도 영향을 미쳤습니다.

    Q. 니들 인 헤이스택(NIAH) 과제는 무엇인가요?

    A. 긴 문서 속에 특정 정보('바늘')를 숨기고 AI 모델이 이를 찾아낼 수 있는지 테스트하는 과제입니다. 실제 문서 요약이나 질의응답 과제를 평가하기 어렵고 비용이 많이 들기 때문에, 긴 맥락 처리 능력을 측정하는 대용 지표로 널리 사용됩니다. 한국어 계약서에서 특정 조항을 찾거나, 긴 회의록에서 결정 사항을 추출하는 실무 작업과 유사합니다.

    Q. 왜 영어보다 폴란드어가 더 높은 성능을 보였나요?

    A. 명확한 이유는 밝혀지지 않았지만, 위키피디아 문서 수가 많고 라틴 문자를 사용하는 슬라브어, 로망스어, 게르만어 계통 언어들이 상위권을 차지했습니다. 단순한 데이터양보다는 언어 계통, 사용 문자, 그리고 긴 맥락 학습 파이프라인에서의 언어별 처리 방식이 복합적으로 영향을 미친 것으로 추정됩니다.

    해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

    논문명: One ruler to measure them all: Benchmarking multilingual long-context language models

    이미지 출처: 이디오그램 생성

    해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




    AI Matters 뉴스레터 구독하기
    태그
    AI
    안내 ?

    말 많은 뉴스

    • 1

      미니 PC, 노트북 싹 다 가짜였습니다. 쿠팡에 침투한 중국 사기단의 정체

      댓글10
      미니 PC, 노트북 싹 다 가짜였습니다. 쿠팡에 침투한 중국 사기단의 정체
    • 2

      최고 완성도를 한단계 더 끌어올린 X3D의 진화, AMD 라이젠 7 9850X3D

      댓글5
      최고 완성도를 한단계 더 끌어올린 X3D의 진화, AMD 라이젠 7 9850X3D
    • 3

      메르세데스-AMG, 4기통 버리고 6기통·V8 귀환… 브랜드 전략 전면 수정

      댓글4
      메르세데스-AMG, 4기통 버리고 6기통·V8 귀환… 브랜드 전략 전면 수정
    • 4

      뜨거운 물 틀었다가 찬물 섞는 사람들은 보세요

      댓글4
      뜨거운 물 틀었다가 찬물 섞는 사람들은 보세요
    • 5

      에스라이즈, 신학기 맞아 'ASUS' 인기 노트북 할인 행사

      댓글4
      에스라이즈, 신학기 맞아 'ASUS' 인기 노트북 할인 행사

    일반뉴스 최신 글

    이전 페이지 1/10 다음 페이지
    • 원작 액션 살렸다, 몬헌 아웃랜더스 무기 소개 영상 공개

      게임메카 10:41:58
      읽음 9 공감 1
    • 크래프톤 "배그 모바일, 작년 중국서 DAU 두 자릿수 성장"

      게임메카 10:40:36
      읽음 13 공감 1
    • [오늘의 스팀] ‘압긍’ 받는 요리판 발라트로, 정식 출시

      게임메카 10:37:07
      읽음 14 공감 1
    • 불법복제 게임 미끼로, PC 40만 대에 악성코드 퍼졌다

      게임메카 10:33:31
      읽음 18
    • 인텔 공인대리점 '모든 가능성을 만들다: All-Play, All-AI' 프로모션 실시

      다나와 10:27:00
      읽음 25
    • 위메이드플레이, 2025년 매출 1253억 원, 영업익 107억 원, 당기순익 214억 원 기록

      게임동아 10:01:09
      읽음 29
    • 대원씨티에스, ASUS ROG 및 TUF 게이밍 기어 유통 계약 체결

      다나와 10:01:01
      읽음 34
    • 엔씨소프트 북미법인 퍼블리싱 총괄에 ‘머빈 리 콰이’ 영입

      게임동아 10:00:56
      읽음 31
    • NHN, 수집형 RPG '어비스디아' 출시 임박…버스 랩핑 등 이색 옥외광고 '러시'

      게임동아 10:00:39
      읽음 33
    • ‘바이오하자드 서바이벌 유닛’ 대만·홍콩 전략 게임 1위 달성

      게임동아 09:58:21
      읽음 34
    • 포트나이트, 케데헌과 두 번째 컬래버로 골든 의상 헌트릭스와 '진우' 등장

      게임동아 09:58:01
      읽음 33
    • 일러스트 제작 과정도 공개! 일러스트레이터 카노가 '매력적인 컨셉'을 창출하기 위해 하고 있는 일

      게임동아 09:55:21
      읽음 34
    • 일러스트 제작의 뒷면도 공개! 크리에이터 Okku가 소중히 하는 창작 마인드란?

      게임동아 09:24:53
      읽음 42
    • 명조 X 컴포즈커피 세미팝업 프리오픈 성료

      게임동아 26.02.09.
      읽음 89 공감 8
    • 불안감 커지는 한미 간 통상 불확실성, 車 업계 특별법 조속 제정 촉구

      오토헤럴드 26.02.09.
      읽음 75 공감 7 댓글 1
    • 독일인 75% "구매 의향 없다" 수치로 확인된 테슬라 브랜드 이미지 급락

      오토헤럴드 26.02.09.
      읽음 79 공감 7 댓글 1
    • 지난해 韓시장 269% 폭풍 성장 후 폴스타가 꺼내든 다음 카드 '초고성능'

      오토헤럴드 26.02.09.
      읽음 78 공감 7
    • [LCK] DN 수퍼스와 DRX의 대반란 속 '혼돈 속 LCK 컵'

      게임동아 26.02.09.
      읽음 62 공감 7
    • 엄마-아빠도 게이머였다…넷플릭스 다큐멘터리가 선사하는 추억 여행 화제[게임 인더스트리]

      게임동아 26.02.09.
      읽음 75 공감 8 댓글 1
    • 바이오하자드 레퀴엠, "그레이스로 도망친 적도, 레온으로 쓰러뜨릴 수 있다"

      게임동아 26.02.09.
      읽음 75 공감 8 댓글 1
    • 크래프톤, 3년간 1조 원 이상 주주환원 추진

      게임동아 26.02.09.
      읽음 66 공감 7
    • 캐킷 ‘럽플레이스’, 설맞이 ‘만복 대축제’ 대규모 업데이트

      게임동아 26.02.09.
      읽음 67 공감 7
    • 웹젠, '드래곤소드' 신규 캐릭터와 콘텐츠 확장에 천장까지 완화

      게임동아 26.02.09.
      읽음 61 공감 7
    • 엔씨 ‘리니지 클래식’, 이틀 만에 누적 접속자 50만, 최대 동접 18만 돌파

      게임동아 26.02.09.
      읽음 78 공감 7
    • 엔씨 '리니지 클래식', PC방 순위 4위 등극.. 자동 플레이 시스템 도입 검토

      게임동아 26.02.09.
      읽음 70 공감 7
    • 그라비티, 신작 ‘라그나로크 오리진 클래식’ 홍콩 지역 CBT 참가자 모집

      게임동아 26.02.09.
      읽음 66 공감 7
    • 크래프톤, 2025년 연간 매출 3조 3,266억, 영업이익 1조 544억

      게임동아 26.02.09.
      읽음 78 공감 7
    • ‘조선협객전 클래식’, 온라인 쇼케이스 통해 상세 정보 공개

      게임동아 26.02.09.
      읽음 73 공감 7
    • 타일 한 칸에서 시작된 작은 왕국. '드랍 더치' 개발한 슬리피 밀 스튜디오

      게임동아 26.02.09.
      읽음 67 공감 7
    • [롤짤] 1만 골드차 역전까지, LCK 친정팀 파괴 메타

      게임메카 26.02.09.
      읽음 83 공감 7
    • 아이작의 번제 개발자 신작 ‘뮤제닉’ 메타크리틱 90점

      게임메카 26.02.09.
      읽음 100 공감 8 댓글 1
    • 문화적 공로, 33 원정대 개발진 전원 기사 작위 받았다

      게임메카 26.02.09.
      읽음 88 공감 8
    • 공포게임 아닙니다, '토마스와 친구들' 기반 신작 발표

      게임메카 26.02.09.
      읽음 92 공감 8
    • 메모리 부족, 엔비디아 올해 GPU 신제품 출시 안 한다?

      게임메카 26.02.09.
      읽음 106 공감 8
    • 레이싱게임 '레이시티' 스팀 페이지 오픈, 진위 여부 화제

      게임메카 26.02.09.
      읽음 94 공감 7
    • 3편 직후 이야기, 발더스 게이트 TV 드라마 발표

      게임메카 26.02.09.
      읽음 92 공감 8 댓글 1
    • 패러독스 CEO “DLC 폭격에 대한 부담감 잘 알고 있다”

      게임메카 26.02.09.
      읽음 87 공감 8
    • [오늘의 스팀] 확률 없는 턴제 전략 신작 ‘메너스’ 출시

      게임메카 26.02.09.
      읽음 96 공감 8
    • [이구동성] 짜잔~ 2 라는 건 없군요

      게임메카 26.02.09.
      읽음 83 공감 2
    • 3인 협동 기계수 토벌, 호라이즌 헌터즈 개더링 공개

      게임메카 26.02.09.
      읽음 82 공감 1
    • 인어 먹으면 불로불사? 파라노마사이트 시리즈 최신작 발표

      게임메카 26.02.09.
      읽음 86 공감 2
    • 도쿄 떠나 새 도시로, 팔콤 '교토 재너두' 베일 벗었다

      게임메카 26.02.09.
      읽음 85 공감 2
    • 업데이트 종료됐던 그랑블루 리링크, 확장팩으로 부활한다

      게임메카 26.02.09.
      읽음 87 공감 2
    • 닌텐도 다이렉트, 스위치 1·2로 출시될 신작 다수 공개

      게임메카 26.02.09.
      읽음 101 공감 2
    • '삼국지 전략판’, 코에이 테크모 ‘삼국지’ 시리즈 40주년 기념 참여

      게임동아 26.02.09.
      읽음 68 공감 1
    • [오늘의 스팀] 돌아온 탱크, 헬다이버즈 2 업데이트 관심

      게임메카 26.02.09.
      읽음 93 공감 2
    • 완성도 높은 사무라이·닌자 액션, 인왕 3 메타크리틱 86점

      게임메카 26.02.09.
      읽음 100 공감 2
    • 와우 총괄 프로듀서 “워크래프트 IP 충분히 활용 못 했다”

      게임메카 26.02.09.
      읽음 87 공감 2
    • 우리 우정 영원히, 살인사건 은폐하는 협동 게임 등장

      게임메카 26.02.09.
      읽음 93 공감 2
    • 스텔란티스 전동화 '리셋'으로 38조원 절감, LG엔솔 협력 구조도 재편

      오토헤럴드 26.02.09.
      읽음 57
    • 경품이 99개! 2월 무~제한 포인트 룰렛

    • <2월 모바일 출석체크> 2월 출석하고 선물받기

    • 이벤트 참여하고 PS5 슬림 내 거 하자!

    스폰서 PICK

    이전 페이지 1/3 다음 페이지
    • 엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스
    • 잘만 ALPHA II DS A36(블랙)

      잘만 ALPHA II DS A36(블랙)

      잘만
    • 앱코 G40 시그니처(블랙)

      앱코 G40 시그니처(블랙)

      앱코
    • darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash
    • AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD
    • 엔티스 배너
    • 다크플래쉬
    • AMD
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) / 우편번호: 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    뒤로
    새로고침 맨위로 이동
    안내

    유용하고 재미있는 정보인가요? 공감이 된다면 공감 버튼을,
    그렇지 않다면 비공감 버튼을
    눌러 주세요!
    공감이나 비공감을 선택 하는 경우
    다나와 포인트를 적립해 드립니다.
    ※ 공감 버튼의 총 선택 횟수는
    전체 공개입니다.
    비공감 버튼의 선택 여부는
    선택한 본인만 알 수 있습니다.

    포인트 안내
    목록
    공감 1
    비공감
    댓글
    공유

    공유받은 친구가 활동하면 포인트를!

    URL이 복사되었습니다.

    공유하기

    레이어 닫기

    지금 보는 페이지가 마음에 든다면
    공유하기를 통해 지인에게 소개해 주세요.

    • 카카오톡
    • 라인
    • 페이스북
    • X
    • 밴드
    https://dpg.danawa.com/mobile/news/view?boardSeq=60&listSeq=5917616 복사

    로그인 유저에게는 공유 활동에 따라
    다나와 포인트가 지급됩니다.

    자세히 >

    URL이 복사되었습니다.