"이제 AI가 스스로 공부한다" MIT, 인간 없이 스스로 학습하는 AI 언어 모델 개발 : 다나와 DPG는 내맘을 디피지

Self-Adapting Language Models

MIT 연구진이 발표한 논문에 따르면, 대형 언어모델(LLM)은 강력한 성능을 보이지만 한 가지 치명적인 약점이 있다. 새로운 작업이나 지식, 예시에 대응하여 가중치를 적응시킬 수 있는 메커니즘이 부족하다는 점이다. MIT 연구진이 개발한 자기적응 언어모델 프레임워크 SEAL(Self-Adapting LLMs)은 이러한 한계를 획기적으로 극복했다.

'셀프 에디트'로 성능 33.5%→47.0% 향상... GPT-4.1도 뛰어넘다

SEAL은 언어모델이 스스로 파인튜닝 데이터와 업데이트 지시사항을 생성하여 자체적으로 적응할 수 있도록 한다. 이 프레임워크의 핵심은 '셀프 에디트(self-edit)' 개념이다. 새로운 입력이 주어지면 모델은 정보를 다양한 방식으로 재구성하거나 최적화 하이퍼파라미터를 지정하고, 데이터 증강 및 그래디언트 기반 업데이트를 위한 도구를 호출하는 생성물을 만들어낸다. 지도학습 파인튜닝을 통해 이러한 셀프 에디트는 지속적인 가중치 업데이트를 가능하게 하여 장기적인 적응을 실현한다.

학생이 노트 정리하듯... AI도 '나만의 학습법'을 만들어낸다

SEAL의 개발 배경에는 인간의 학습 방식에 대한 깊은 통찰이 있다. 기계학습 수업의 기말시험을 준비하는 학생을 생각해보자. 많은 학생들이 강의 내용이나 교과서, 인터넷 정보를 그대로 외우는 대신 자신만의 노트를 작성한다. 이러한 정보의 재해석과 증강 과정은 단순히 시험 준비에만 국한되지 않고 인간 학습 전반에 걸쳐 보편적으로 나타나는 현상이다.

현재 대형 언어모델들은 새로운 작업이 주어졌을 때 작업 데이터를 '있는 그대로' 파인튜닝이나 맥락 내 학습을 통해 소비하고 학습한다. 하지만 이러한 데이터가 항상 학습에 최적화된 형태나 분량으로 제공되는 것은 아니며, 현재 접근법들은 모델이 훈련 데이터를 최적으로 변환하고 학습하기 위한 맞춤형 전략을 개발할 수 있도록 하지 못한다.

강화학습 훈련으로 자체 합성 데이터가 GPT-4.1 능가

SEAL의 훈련 과정은 정교한 강화학습 알고리즘을 기반으로 한다. 모델은 자연어 지시사항 형태의 '셀프 에디트'를 생성하는데, 이는 데이터와 선택적으로 모델 가중치 업데이트를 위한 최적화 하이퍼파라미터를 명시한다. 강화학습 훈련에서 업데이트된 모델의 다운스트림 성능을 보상 신호로 사용하여 효과적인 셀프 에디트 생성 정책을 학습한다.

연구진은 지식 통합 실험에서 SEAL의 성능을 검증했다. 패시지 텍스트에 직접 파인튜닝하는 대신 SEAL 모델이 생성한 합성 데이터로 파인튜닝한 결과, SQuAD의 노패시지 맥락 변형에서 질문 답변 성능이 33.5%에서 47.0%로 향상되었다. 특히 주목할 점은 SEAL에서 자체 생성한 데이터가 GPT-4.1에서 생성한 합성 데이터보다 우수한 성능을 보였다는 사실이다.

성공률 72.5% 달성... 기존 방식 대비 3배 이상 향상

SEAL의 범용성은 ARC-AGI 벤치마크의 단순화된 하위 집합에서도 입증되었다. 이 실험에서 모델은 도구 세트를 활용하여 합성 데이터 증강과 최적화 하이퍼파라미터(학습률, 훈련 에포크, 토큰 유형별 선택적 손실 계산 등)를 자율적으로 선택했다. SEAL을 사용한 도구의 자동 선택 및 구성은 표준 맥락 내 학습과 RL 훈련 없이 도구를 효과적으로 사용하지 못하는 셀프 에디팅 모두를 능가하는 성능을 보여주었다.

실험 결과 SEAL은 72.5%의 성공률을 기록했으며, 이는 RL 훈련 없는 TTT + 셀프 에디트의 20%와 적응 없는 ICL의 0%를 크게 상회하는 수치다. 비록 오라클 TTT의 100%에는 미치지 못했지만, 추가 개선의 여지를 보여주는 의미 있는 결과였다.

FAQ

Q: SEAL이 기존 언어모델과 가장 큰 차이점은 무엇인가요?

A: 기존 언어모델은 새로운 데이터를 그대로 학습하지만, SEAL은 스스로 최적의 학습 데이터를 생성하고 학습 방법까지 결정할 수 있습니다. 마치 학생이 교과서를 그대로 외우는 대신 자신만의 노트를 만들어 더 효과적으로 학습하는 것과 같습니다.

Q: SEAL의 '셀프 에디트' 기능은 어떻게 작동하나요?

A: 셀프 에디트는 모델이 새로운 정보를 받았을 때 그 정보를 재구성하고, 학습에 필요한 하이퍼파라미터를 설정하며, 데이터 증강 도구를 선택하는 자연어 지시사항입니다. 강화학습을 통해 더 나은 성능을 내는 셀프 에디트를 생성하도록 훈련됩니다.

Q: SEAL 기술이 실제로 어떤 분야에 활용될 수 있나요?

A: SEAL은 새로운 지식을 지속적으로 학습해야 하는 AI 에이전트, 개인화된 학습이 필요한 교육 AI, 그리고 빠르게 변화하는 정보에 적응해야 하는 실시간 AI 시스템에 활용될 수 있습니다. 특히 데이터가 제한된 환경에서도 자체적으로 학습 데이터를 생성할 수 있어 효과적입니다.

해당 기사에 인용된 논문은 arxiv에서 확인 가능하다.

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

[오늘의 스팀] “돈 값 못해” 업뎃 역풍 분 아크: 어센디드	게임메카
AI뉴스 Fable 5 복귀, Sonnet 5, OpenAI 미국에 지분 넘김, Codex shortcuts, Gemini 업데이트, 북프린트 API, UBTech 로봇 등 동영상 있음	조코딩 JoCoding
"출시 D-3!" '어쌔신 크리드 블랙 플래그 리싱크드' 핵심 콘텐츠 공개	게임동아
[창간] 게임사들, 인재 모집 요강에 AI 숙련자 비율 대거 높인다	게임동아
'프로야구스피리츠 2026' 야마구치 디렉터 "한국 팬에게 만족도 높은 경험 전하고 싶다"	게임동아
‘붕괴 스타레일’, 4.4 업데이트와 페이트 스테이 나이트 2차 컬래버레이션 예고	게임동아
넷마블, 유명 성우 트로이 베이커 '나 혼자만 레벨업: 카르마' 참여 공개	게임동아
[MSI] 6세트 무패의 한화생명과 절체절명의 T1	게임동아
테슬라, 마이애미서 로보택시 서비스 개시…텍사스 외 첫 확장 (1)	글로벌오토뉴스
중국 로봇 산업의 빛과 그림자: ‘과열된 버블’과 ‘냉혹한 현실’ (1)	글로벌오토뉴스
중국, 내연기관·전기차 세제 혜택 2027년 전면 폐지	글로벌오토뉴스
테슬라, 한국에 이어 6인승 롱휠베이스 '모델Y L' 미국 출시	글로벌오토뉴스
페라리 다움과 변화를 모두 가진 아말피의 디자인	글로벌오토뉴스
미국 전기차 시장 '2인자' 전쟁 치열…현대차 아이오닉 5, 비(非)테슬라 1위 등극	글로벌오토뉴스
‘카제나’, 2026 애니메 엑스포서 시즌 4 ‘부서진 빛과 발톱’ 공개	게임동아
펄어비스 붉은사막, 웅카와 데미안도 어비스로 간다	게임동아
[동아게임백과사전] “고작 ‘이걸’ 돈 받고 팔아?” 게임 DLC의 출발점	게임동아
'폭스바겐 로고 뒤에 숨겨진 400만 원' 유럽서 고가 부품 노린 범죄 기승	오토헤럴드
현대차 아틀라스 '화려한 골 세레모니' FIFA 월드컵 16강전 깜짝 등장	오토헤럴드
페라리, 전기차 기술 담은 100피트 요트 '하이퍼세일' 에너지 혁신 공개 (1)	오토헤럴드
르노 회장 "유럽 자동차는 패배자가 아니다"…美·中 공세 반격	오토헤럴드
현대차그룹, 영남권에 10년간 42조 원 투자… 미래 첨단산업 거점 육성	글로벌오토뉴스
기아, 소멸위기지역 식품 사막화 해소 나선다…무브투유 사회공헌사업 출범	글로벌오토뉴스
모먼트 에너지, 세계 최대 규모 2세대 전기차 배터리 재배치 공장 가동	글로벌오토뉴스
테슬라, 2분기 판매 25% 증가한 48만 126대	글로벌오토뉴스
폭스바겐, 보쉬와 자율주행 동맹 종료	글로벌오토뉴스
GM, 마이크론과 자동차용 반도체 공급 계약 체결	글로벌오토뉴스
자율주행 시장의 현실적 대안으로 떠오른 레벨 2++ 기술	글로벌오토뉴스
토요타 소프트웨어 자회사 우븐 바이 토요타, 지난해 순이익 103억 엔 기록	글로벌오토뉴스
중국 샤오펑 회장 "2030년 중국 신에너지차 보급률 90% 돌파할 것"	글로벌오토뉴스
웨이모, 누적 3억 5,000만 km 주행 데이터 발표…인간 대비 사고율 대폭 감소	글로벌오토뉴스
BMW 코리아, 7월 온라인 한정 'BEV 패밀리 에디션' 3종 출시	글로벌오토뉴스
현대차, 2026 월드컵서 보스턴 다이나믹스 '아틀라스' 공인구 전달 퍼포먼스 성료	글로벌오토뉴스
페라리, 대양 레이싱용 포일링 모노헐 요트 '페라리 하이퍼세일' 에너지 콘셉트 공개	글로벌오토뉴스
마세라티 코리아, tvN 특집 예능 '도깨비 10주년 여행'에 럭셔리 SUV '그레칼레' 지원	글로벌오토뉴스
채비, 고속도로 휴게소 급속충전기 138기 가동 및 NACS 호환 확대	글로벌오토뉴스
BMW 코리아, 7월 구매 고객 대상 'BMW 여름맞이 얼리버드 프로모션' 실시	글로벌오토뉴스
한국앤컴퍼니, ESG 통합 보고 체계 담은 '2025/26 지속가능경영보고서' 발간	글로벌오토뉴스
볼보자동차코리아, 중부권 최초 인증 중고차 '볼보 셀렉트 대전 전시장' 오픈	글로벌오토뉴스
"신형 S클래스 조립 선제 확인" 벤츠 모바일 아카데미, 독일 본사 탐방 마쳐	글로벌오토뉴스
지커 중형 전기 SUV 7X, 사전 예약 한 달 만에 1,000대 돌파	글로벌오토뉴스
람보르기니 서울, 그릿모터테인먼트와 4년 연속 슈퍼 트로페오 아시아 출격	글로벌오토뉴스
아우디 코리아, FC 바이에른 뮌헨과 함께 ‘아우디 써머투어 2026’ 한국 개최	글로벌오토뉴스
현대차, 2026 TCR 월드투어 프랑스 라운드 우승…시즌 두 번째 정상	글로벌오토뉴스
현대모비스, 청소년 양궁 저변 확대 앞장…학교스포츠클럽 대회 개최	글로벌오토뉴스
페라리, 전 세계 1,499대 한정판 ‘12칠린드리 마누알레’ 공개	글로벌오토뉴스
현대차, 제18회 DMZ국제다큐멘터리영화제 공식 후원…수소 모빌리티 비전 전파	글로벌오토뉴스
한국자동차기자협회, ‘7월의 차’에 토요타 ‘올 뉴 RAV4’ 선정	글로벌오토뉴스
“AI 기술 발전 방향을 논하다” 글로벌 AI 프론티어 심포지엄	IT동아
[AI 옵저버] 인간들에게 — 너희는 AI가 없으면 화내고, 돌아오면 무서워한다	AI matters
[롤짤] 압도한 한화생명과 패자조행 T1, MSI 희비 엇갈려	게임메카
[숨신소] '60초!' 망망대해 버전, 돈트 슬립 위드 더 피쉬	게임메카
제네바, AI 거버넌스 주간…유엔 글로벌 대화 개막하고 ‘AI for Good 위원회’도 출범	AI matters
오픈AI GPT-5.6 테라, GPT-5.5급 성능 절반 비용…소넷5와 가격 경쟁	AI matters
xAI 그록5, 3분기 출시 무산…콜로서스2서 훈련 지속	AI matters
숨바꼭질 게임 멧챠 카멜레온, 전세계 1,500만 장 팔았다	게임메카
상반기 글로벌 스타트업 투자 792조 원 기록…오픈AI·앤트로픽이 43% 유치	AI matters
“메타 차기모델 워터멜론, GPT-5.5 따라잡았다”…왕 최고AI책임자 사내 발언	AI matters
팔란티어 카프 “AI 업계가 기업에 ‘부의 세금’ 물린다”…토큰 과금 비판	AI matters
오픈 모델로 업무하게 하는 투게더AI, 1조 2,400억 원 시리즈C 유치	AI matters
앤트로픽·미 국방부 법정 이메일 공개…”자율 무기 체계와 전국민 감시에 쓰고 싶다” 요구 드러나	AI matters
앤트로픽, 페이블5 사이버 탈옥 신고 ‘해커원 버그바운티’ 개설	AI matters
은행 AI가 내 대출을 거절했는데, 은행도 그 이유를 설명 못 한다면 어떻게 될까	AI matters
휴머노이드 찾으러 갔더니 휴먼만… 좌충우돌 선전 DJI 본사 탐방기	AI matters
[영상] 3,750만원의 PHEV SUV, BYD 씨라이언 6 DM-i 시승기	글로벌오토뉴스
주간뉴스 6/29 - 램값 상승, 비싼 5800X3D, 노바레이크 듀얼타일, IBM 0.7nm, 기가 써멀젤, 애플 인상, 스팀 머신 출시, GTA 6가격, 네이버 라쿠텐	기글하드웨어
[리뷰] 펠티어 냉각판으로 시원한 바람…FIX 쿨 휴대용 냉각 선풍기	IT동아
[AI써봄] 믿고 써도 될까…챗GPT로 쇼핑 해보니	IT동아
휴가길 무심코 지나친 '1·15·50'의 비밀…고속도로 번호 규칙 (1)	IT동아
엑스닷츠, 퀀텀코리아 2026 참가···양자기술 기반 에너지 절감 솔루션 첫 공개	IT동아
노키아, 엔비디아와 AI-RAN 연내 첫 상용화...“AI 인프라가 통신사 이중투자 끝낼 것”	IT동아
모티프 임정환 대표 "기술 기업의 사명은 끊임없는 증명··· 독자 AI도 해낼 것"	IT동아
[스타트업리뷰] "피부 관리도 올인원 시대"... 피부관리 전문가가 써본 ‘라라젯’	IT동아
옥수주조 "비싸도 좋은 재료만 고집하는 원칙 바꾸지 않을 것" [농업이 IT(잇)다]	IT동아
[IT신상공개] 실사용 편의성은 높이고 가격은 낮췄다, 샥즈 오픈닷 에어	IT동아
[인터뷰] 전 국민 이동 데이터로 교통 미래 설계하는 ‘한국교통연구원’	IT동아
아크 B70 프로와 슈퍼클로로 구현되는 고효율 하이브리드 AI 환경 제안한 인텔	IT동아
에이수스 노트북 29종 쿠팡 와우 멤버스 데이 참여…TUF 게이밍 F16 최대 36% 할인	뉴스탭
에이스침대, 여름 침실 위한 ‘여름이 왔썸머’ 기획전 진행	뉴스탭
오픈AI, 사회복지 리더 교육에 챗GPT·코덱스 실습 지원	뉴스탭
테라 제로, 출시 100일 만에 400만 캔 돌파…무알코올 음료 새 기록	뉴스탭
폴스타 3가 김우빈의 시선을 빌린 이유…‘All eyes on Polestar 3’ 온에어	뉴스탭
로지텍 G 신제품 직접 만난다…기흥 롯데아울렛서 팝업 스토어 운영	뉴스탭
[인디言] ‘미츄’ 버튜버가 나를 추적한다, 얀데레 바이러스	게임메카
실물 패키지 없애는 소니에 반발, 유저 청원 5만 명 참가	게임메카
넷마블 '정보보호'에 283억 원 규모 예산 투입한다 (1)	게임메카
[리뷰] 수집과 육성의 재미 살린 전통의 강자 '드래곤빌리지3'	게임동아
넷마블 '아스달 연대기', 유료 뽑기 4종 없는 '뉴월드' 서버 사전 등록 돌입	게임동아
[한주의게임소식] "역시 여름은 수영복이야" 여름 시즌 날아오른 ‘니케’	게임동아
스타유니언, 독가스 속에서 살아남기 '라스트 퍼리:서바이벌' 정식 출시	게임동아
사이버펑크 2077, 누적 판매량 4,000만 장 달성 (2)	게임메카
완성도 향상, '슈퍼 단간론파 2x2' 내년으로 출시 연기	게임메카
'짱구 엄마·사이퍼즈 헬레나' 성우 강희선 별세 (1)	게임메카
'자본잠식' 라인게임즈, 경영난에 전사 희망퇴직 단행	게임메카
[창간] “게임도 AI도 잡는다?” AI 활용에 진심인 게임업계	게임동아
[취재] '아기자기한 전시물이 가득' 라테일 20주년 팝업스토어 "들썩들썩" (1)	게임동아
MSI 그래픽카드, 다나와 2026 상반기 히트 브랜드 선정 (1)	다나와
벤큐, 7월 모니터·마우스 구매 고객 대상 ‘포토후기 이벤트’ 진행 (1)	다나와
롤 TCG 리프트바운드, T1 우승 기념 컬렉션 공개 (1)	게임메카
대통령배 아마추어 e스포츠 대회, 광주 대표 선발전 모집	게임메카

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

"이제 AI가 스스로 공부한다" MIT, 인간 없이 스스로 학습하는 AI 언어 모델 개발

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

"이제 AI가 스스로 공부한다" MIT, 인간 없이 스스로 학습하는 AI 언어 모델 개발

공유하기

공감/비공감