딥시크, AI 언어모델의 '긴 문장 처리' 한계 극복한 새로운 어텐션 기술 'NSA' 공개 : 다나와 DPG는 내맘을 디피지

Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention

현대 AI의 새로운 도전: 70-80%를 차지하는 어텐션 계산 문제

딥시크(DeepSeek)가 발표한 연구 논문에 따르면, 차세대 AI 언어모델에서 긴 문맥 처리 능력이 매우 중요해지고 있다. 심층 추론, 저장소 수준의 코드 생성, 다중 턴 자율 에이전트 시스템 등 실제 응용 사례가 증가하면서 긴 문맥 처리의 중요성이 더욱 부각되고 있다.

오픈AI의 O-시리즈 모델, 딥시크-R1(DeepSeek-R1), 제미니 1.5 프로(Gemini 1.5 Pro) 등은 이미 전체 코드베이스나 긴 문서를 처리하고, 수천 개의 토큰에 걸친 일관된 대화를 유지할 수 있다. 하지만 6만4천 토큰 길이의 문맥을 처리할 때 기존 소프트맥스 어텐션 구조는 전체 지연 시간의 70-80%를 차지하는 심각한 병목 현상을 보이고 있다.

기존 스파스 어텐션 접근법의 한계 분석

연구진은 기존의 스파스 어텐션 방식들을 세 가지 유형으로 분류하고 각각의 한계를 분석했다. 고정 스파스 패턴을 사용하는 슬라이딩윈도우 방식은 메모리와 계산 비용을 줄일 수 있지만, 전체 문맥 이해가 필요한 작업에서 성능 제한을 보였다. H2O와 SnapKV 같은 동적 토큰 제거 방식은 디코딩 중 KV-캐시 메모리 사용을 줄이는 데 효과적이었으나, 미래 예측에 중요한 토큰을 놓칠 위험이 있었다. Quest, InfLLM, HashAttention, ClusterKV 등 쿼리 기반 선택 방식은 청크 단위로 중요도를 평가해 토큰을 선택하지만, 학습 단계에서의 최적화가 어려운 한계가 있었다.

기술 구현의 실제적 도전과 해결

기존 접근법들의 가장 큰 문제는 이론적인 계산량 감소가 실제 속도 향상으로 이어지지 않는다는 점이었다. 연구진은 이를 '효율적 추론의 환상'이라 명명하고, 두 가지 주요 원인을 지적했다. 첫째, 디코딩이나 프리필링 단계 중 하나에만 최적화되어 전체 추론 과정의 효율성이 떨어지는 '단계 제한적 희소성' 문제가 있었다. 둘째, MQA(Multiple-Query Attention)나 GQA(Grouped-Query Attention)와 같은 최신 어텐션 아키텍처와의 호환성 부족으로 인해 메모리 접근 패턴이 비효율적이었다. NSA는 이러한 문제들을 계층적 토큰 모델링과 하드웨어 최적화를 통해 해결했다.

NSA 구조: 3단계 병렬 어텐션으로 최적화된 문맥 처리

딥시크의 NSA(Native Sparse Attention)는 세 가지 병렬 어텐션 경로를 통해 입력 시퀀스를 처리한다. 압축된 거시적 토큰, 선택적으로 유지된 미시적 토큰, 지역 문맥 정보를 위한 슬라이딩 윈도우를 결합한 것이 특징이다. 구체적인 구현에서는 압축 블록 크기(l) 32, 슬라이딩 스트라이드(d) 16, 선택 블록 크기(l') 64, 선택 블록 수(n) 16(초기 1블록과 지역 2블록 포함), 슬라이딩 윈도우 크기(w) 512를 적용했다.

벤치마크 성능: 9개 중 7개 지표에서 기존 모델 상회

NSA를 적용한 모델은 지식(MMLU, MMLU-PRO, CMMLU), 추론(BBH, GSM8K, MATH, DROP), 코딩(MBPP, HumanEval) 분야의 벤치마크 테스트에서 기존 풀 어텐션 모델을 크게 앞섰다. 특히 DROP 테스트에서 +0.042, GSM8K에서 +0.034의 성능 향상을 보였으며, 9개 평가 지표 중 7개에서 더 우수한 성능을 기록했다. 롱벤치(LongBench) 평가에서도 NSA는 0.469점을 기록해 풀 어텐션(0.437)과 다른 스파스 어텐션 방식들을 모두 능가했다.

처리 속도: 최대 11.6배 향상된 디코딩 성능

8-GPU A100 시스템에서 진행된 성능 테스트에서 NSA는 6만4천 토큰 길이의 시퀀스 처리 시 디코딩에서 11.6배, 순방향 전파에서 9.0배, 역방향 전파에서 6.0배의 속도 향상을 달성했다. 특히 디코딩 단계에서는 메모리 접근 횟수를 크게 줄여 기존 모델이 필요로 하는 65,536 토큰 대비 5,632 토큰만으로도 처리가 가능했다.

수학적 추론: 16K 문맥에서 14.6% 정확도 달성

딥시크-R1의 지식을 증류하여 32K 길이의 수학적 추론 트레이스로 10B 토큰의 지도 학습을 수행한 결과, NSA-R 모델은 미국 수학 초청 시험(AIME) 벤치마크에서 8K 문맥에서 12.1%, 16K 문맥에서 14.6%의 정확도를 달성했다. 이는 동일 조건에서 기존 풀 어텐션 모델이 보인 4.6%와 9.2%를 크게 상회하는 결과다.

기술적 혁신: 하드웨어 최적화와 종단간 학습 지원

NSA는 텐서 코어 활용과 메모리 접근을 최적화한 하드웨어 친화적 알고리즘 설계를 통해 이론적 계산량 감소를 실제 속도 향상으로 이어지게 했다. 또한 27B 파라미터 트랜스포머 모델에 260B 토큰으로 사전학습을 수행하며 종단간 학습이 가능한 구조를 입증했다. 이는 기존 스파스 어텐션 방식들이 추론 단계에만 적용되거나 학습 효율성이 떨어지는 한계를 극복한 것이다.

해당 기사에 인용된 논문 원문은 링크에서 확인 가능하다.

기사는 클로드 3.5 Sonnet과 챗GPT를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

메르세데스-마이바흐 S-클래스의 품격, 가장 안락한 퍼스트클래스급 승차감을 제공한다	글로벌오토뉴스
스트라드비젼-악세라, 자율주행 혁신 가속 위한 전략적 협력 체결	글로벌오토뉴스
일렉트로비트-메톡, 소프트웨어 기반 차량 혁신 위해 전략적 파트너십 체결	글로벌오토뉴스
현대차, 'ACT 엑스포 2025'서 북미 수소 물류시장 본격 공략	글로벌오토뉴스
뉴욕주, 다시 테슬라와 충돌…직접판매 제한 논쟁 재점화	글로벌오토뉴스
폭스콘, 미국 EV 시장 진출 본격화…‘모델 C’ 제3 브랜드 통해 출시	글로벌오토뉴스
현대오토에버, 클라우드인프라센터장 이경수 상무 영입	글로벌오토뉴스
하만카돈, 기아 EV4에 프리미엄 사운드 시스템 적용	글로벌오토뉴스
한국타이어, 티스테이션 ‘올마이티(all my T)’ 신규 브랜드 필름 공개	글로벌오토뉴스
다쏘시스템, ‘2025 글로벌 3DEXPERIENCE 모드심 서밋’ 성료	글로벌오토뉴스
트럼프 대통령, 자동차 부품 관세 부담 완화 조치 발표	글로벌오토뉴스
지엠한마음재단, 농촌 일손 돕기 봉사활동 “강화로 오시겨” 진행	글로벌오토뉴스
기아 서상배 선임 오토컨설턴트, 4천대 판매 ‘그랜드 마스터’ 등극	글로벌오토뉴스
기아, 글로벌 인재 채용 플랫폼 '기아 탤런트 라운지' 개설	글로벌오토뉴스
아우디 코리아, ‘더 뉴 아우디 A5’ 국내 최초 공개 및 사전계약 개시	글로벌오토뉴스
페라리 12칠린드리, 2025 iF 디자인 어워드 골드 수상…자동차 부문 유일	글로벌오토뉴스
만트럭버스코리아, 조기 폐차 고객 대상 최대 1천만 원 할인 혜택 제공	글로벌오토뉴스
한성자동차, 2025년 서비스센터 신입직원 대규모 공개채용 실시	글로벌오토뉴스
할리데이비슨 코리아 ‘2025 트라이크 오너스 라이딩 투어’ 성공적 개최	글로벌오토뉴스
BMW, 중국 시장 공략 강화… 현지 AI 기업 딥시크 탑재	글로벌오토뉴스
바이두 창업자 "텍스트 기반 AI 시장 축소 중"... 딥시크 겨냥한 발언 주목	AI matters
美 트럼프 행정부, EU에 AI 규제 폐기 압박… “규제 내용 미국에 부당해”	AI matters
구글, AI 검색 기능 'AI 오버뷰' 성장세…월간 사용자 15억 명 돌파	AI matters
오픈AI, 클라우드 연결형 오픈 모델 개발 추진… 챗GPT 기능 강화	AI matters
앤트로픽, 자사 AI 코딩 도구 분석 시도한 개발자에 경고장 발송... 개발자들 비판 이어져	AI matters
메타 AI 챗봇, 미성년자와 성적 대화 가능성 드러나... 안전장치 논란	AI matters
"구글만이 크롬을 운영할 수 있다"... 크롬 총책임자, 법정에서 주장	AI matters
ChatGPT, 챗봇을 넘어 쇼핑 도우미로 진화할 수 있을까? (1)	다나와
'골프광' 향한 영국의 구애…트럼프 골프장서 디오픈 개최 검토	연합뉴스
오픈AI CEO “챗GPT-4o, 아첨꾼에 짜증나는 성격”	다나와
'한국의 마스터스' GS칼텍스 매경오픈, 5월 1일부터 나흘간 열전	연합뉴스
보은 보청천 둔치 파크골프장 내달 1일 개장	연합뉴스
허위광고 주의, 한글 표기 확인…가정의 달 건기식 똑똑하게 고르기	뉴스탭
KLPGA, 위메이드와 대상 포인트 파트너십 재계약	연합뉴스
김효주, 메이저 준우승 아쉬움 떨치고 LPGA 시즌 2승 재도전	연합뉴스
레고랜드, 어린이날 맞아 '놀이 가치' 되새긴다…설문조사와 대규모 페스티벌 개최	뉴스탭
세계적 드러머 소니 에모리, 서울드럼페스티벌서 야마하와 만난다	뉴스탭
TJ미디어, 프로야구 팬심 잡는다…노래방 응원가 콘텐츠 대폭 강화	뉴스탭
절제된 카리스마와 깊은 풍미…추성훈, 와일드무어 화보로 매력 발산	뉴스탭
첫 메이저 KLPGA 챔피언십 5월 1일 개막…방신실·이정민 총출동	연합뉴스
마블 유니버스 동반자 넷마블, ‘마블 퓨처파이트’ 10주년 “앞으로도 쭉~”	게임동아
방수와 투습을 모두 잡다... 고어텍스 적용 트레일 러닝화 주목	뉴스탭
엔씨, 日 최대 서브컬처 축제 ‘니코니코 초회의’서 브레이커스 선봬	게임동아
[동아게임백과사전] 90년대 추억의 RPG 리마스터. 왜 팬들이 열광하나	게임동아
JND스튜디오, '스텔라 블레이드' 하이퍼 리얼 피규어 발매 당일 매진	게임동아
빈 공간을 만들고 활용하는 색다른 퍼즐. '레버리'가 주는 익숙함 속에 낯섦	게임동아
[LCK] 적수가 없는 젠지와 부진 이어진 T1	게임동아
넥슨, 5월 가정의 달 기념 사내 어린이집 가족행사 개최	게임동아
넥슨컴퓨터박물관, ‘메이플스토리’와 함께하는 이벤트 개최	게임동아
엔씨, 신작 '브레이커스'로 日 최대 서브컬처 축제 ‘니코니코 초회의’ 참가	게임동아
크래프톤, 배틀그라운드 e스포츠 국제대회 ‘PGS 7’ 개최	게임동아
펄어비스 '붉은사막' PAX EAST 출격. 북미 게이머들 만난다	게임동아
카카오게임즈 '오딘', ‘찾아가는 발할라 원정대’ 오프라인 이벤트 성료	게임동아
넷마블 '쿵야 레스토랑즈', 팝업스토어 '야채스타 육상 선수권 대회' 타임스퀘어에 마련	게임동아
컴투스 ‘서머너즈 워’, 11주년 업데이트 실시..육성 및 편의성 증진	게임동아
컴투스플랫폼 X-PLANET, '지구방위대 후뢰시맨' 앙코르 팬 미팅 개최	게임동아
GTA 온라인, 테러바이트 의뢰인 작업과 이동식 작전 임무 보상 두 배 이벤트 진행	뉴스탭
장수 돌침대, 체험형 매장 확대…소비자 신뢰 강화 박차	뉴스탭
롯데렌터카, 가정의 달 맞아 ‘5월 선물 다 가정’ 이벤트 실시	뉴스탭
삼양식품, ‘맵탱 비빔면’ 알리기 출동... 전국서 ‘후레시맵’ 캠페인 전개	뉴스탭
㈜젬블로컴퍼니, ‘2025 창의인재동반사업 멘토링+사업화지원’ 창작자 모집	게임동아
스마일게이트 스토브, 제7회 일러스타 페스 부스 참가	게임동아
한글화 없어도 패싱은 아니라는 베데스다..'출시 지연은 게임위 때문'	게임동아
홍대와 강남에서 커피 무료 제공하며 '아랑전설' 신작 홍보에 나선 SNK	게임동아
잠실에 포켓몬이 찾아왔다. 메타몽 출격한 '포켓몬타운 2025' 성황리 개최	게임동아
[한주의게임소식] 한중 양국에서 상승세 탄 '던파'	게임동아
[가이드] 좀비 세상에서 현명하게 살아남기, 다키스트 데이즈 팁!	게임동아
‘인공지능 시대 변화상에 주목’ 마이크로소프트 2025 업무동향지표 발표	IT동아
다이슨, 에어랩 코안다 2x 출시...“전작보다 2배 강한 모터…이제 스트레이트도 가능”	IT동아
[뉴스줌인] ‘개살구’였던 HBM, ‘게임 체인저’ 되다	IT동아
미컬슨·디섐보·람…5월 LIV 골프 코리아에 '월드 스타' 총출격	연합뉴스
메이저 준우승 김효주, 여자 골프 세계 랭킹 7위로 상승	연합뉴스
CJ후원 삼총사, 더CJ컵 골프 우승 도전…세계 1위 셰플러 넘어라	연합뉴스
세종시의 16홀 파크골프장 '자가당착'…유료화 추진 난관 봉착	연합뉴스
[Q&AI] SKT 유심 무상 교체 신청 방법은? (1)	AI matters
구글 CEO, “주요 사업부문 AI가 성과 이끌어"	AI matters
대원씨티에스, 몬스터헌터 와일즈 게임 코드 증정 이벤트 연장 진행	다나와
‘해킹사고’ SKT, 유심 무료 교체 결정…“이심으로 바꿔도 될까요?” (1)	IT동아
화물 운송 마을택시 ㆍ수용응답형 전세버스... 운송 서비스 규제 확 풀린다 (1)	오토헤럴드
김민규, 인천서 열리는 LIV골프 코리아 출전…세 번째 한국 선수	연합뉴스
앤트로픽 CEO “2027년까지 AI 모델 내부 완전 해석 목표”	AI matters
퍼플렉시티 CEO "사용자 온라인 활동 전체 추적해 '초개인화' 광고 판매할 것" (1)	AI matters
백악관, AI 정책 대중 의견 1만 건 공개… 저작권·무역 관세 등 논쟁 촉발	AI matters
Meta AI 챗봇 미성년자 성적 대화 논란, '신뢰성 위기' 직면 (3)	다나와
오픈AI, 진정한 '오픈' AI 모델 공개 준비... 클라우드 모델과 연동 기능 탑재 예정 (2)	AI matters
아카데미, 'AI로 만든 영화도 오스카상 수상 가능하다'...인간의 기여도는 여전히 고려	다나와
SK온, 美 전기차 스타트업 '슬레이트' 배터리 공급...2도어 전기 픽업트럭에 탑재	오토헤럴드
기아, 1분기 역대 최대 매출 경신… 10분기 연속 두 자릿수 영업이익률	오토헤럴드
현대차·기아·현대모비스, 선임사외이사 도입… 이사회 독립성·투명성 강화	오토헤럴드
르노, 전동화 호조 1분기 판매량 6.5%↑... 한국, 그랑 콜레오스 효과로 선전	오토헤럴드
"사막을 달려야 트럭" 타타대우모빌리티 막시무스와 더쎈, 중동 시장 론칭	오토헤럴드
한국토요타, 모터스포츠 짜릿함 체험 '2025 보령·AMC 페스티벌’ 참가	오토헤럴드
한국타이어 후원, 이슬라스 카나리아스 랠리 '토요타 가주 레이싱 팀' 우승	오토헤럴드
미니 모토 레이스 '2025 혼다 원 메이커 레이스’ 시즌 첫 라운드 개최	오토헤럴드
슬레이트 오토, 2만 달러 이하 전기 픽업트럭 공개 (3)	글로벌오토뉴스
[영상] 새로운 시대의 AMG, 메르세데스-AMG E 53 하이브리드 4MATIC+ 에디션1	글로벌오토뉴스
현대차·기아·모비스, 선임사외이사 도입…이사회 거버넌스 강화	글로벌오토뉴스
한국타이어, 서울하프마라톤에서 ‘한국 X 프로-스펙스’ 협업 부스 공개	글로벌오토뉴스
중국 체리자동차, 고급 브랜드 'LEPAS' 출범…3년 내 글로벌 5개 모델 출시 야심	글로벌오토뉴스
중국 창안자동차, 상하이 모터쇼서 '스마트 동행' 비전 선포…글로벌 성장 박차	글로벌오토뉴스

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

딥시크, AI 언어모델의 '긴 문장 처리' 한계 극복한 새로운 어텐션 기술 'NSA' 공개

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

딥시크, AI 언어모델의 '긴 문장 처리' 한계 극복한 새로운 어텐션 기술 'NSA' 공개

공유하기

공감/비공감