하버드·스탠포드 등 연구팀, AI 에이전트 ‘적응’ 기술 제시… "본체 고정·도구만 훈련해 학습 효율 70배 향상” : 다나와 DPG는 내맘을 디피지

AI가 점점 더 복잡한 일을 하게 되면서, AI를 특정 작업에 맞게 조정하는 '적응' 기술이 중요해지고 있다. 미국 일리노이대학교, 스탠포드대학교, 프린스턴대학교 등 14개 연구 기관이 공동으로 발표한 논문에 따르면, AI 에이전트를 효율적으로 학습시키는 4가지 방법을 정리했다. 특히 'AI 본체를 고정하고 주변 도구만 훈련시키는' 방식이 기존 방법보다 70배 적은 데이터로 같은 성능을 낼 수 있다는 점이 주목받고 있다.

AI 학습법 4가지로 나눴다... 핵심은 '무엇을' '어떻게' 훈련시키느냐

연구진은 AI 에이전트 학습 방법을 크게 두 가지 기준으로 나눴다. 첫 번째는 'AI 본체를 훈련시키는 방법'이고, 두 번째는 'AI가 사용하는 도구를 훈련시키는 방법'이다. 이를 다시 세부적으로 나누면 총 4가지 방법이 나온다.

AI 본체를 훈련시키는 방법은 두 가지다. 'A1 방식'은 AI가 사용한 도구의 실행 결과를 보고 학습한다. 예를 들어 코드를 실행했을 때 제대로 작동했는지, 검색 결과가 관련성이 높은지 등을 확인하며 배운다. 'A2 방식'은 AI가 내놓은 최종 답변의 정확성이나 품질을 평가받아 학습한다.

도구를 훈련시키는 방법도 두 가지다. 'T1 방식'은 AI 본체와 상관없이 검색기, 계획기 같은 도구를 독립적으로 훈련시킨다. 훈련된 도구는 어떤 AI에도 붙여서 사용할 수 있다. 'T2 방식'은 AI 본체를 그대로 두고, 그 AI의 출력 신호를 활용해 도구만 훈련시킨다. 고정된 AI가 제공하는 피드백을 바탕으로 도구가 발전하는 방식이다.

학습 데이터 70분의 1로 줄였다... 훈련 샘플 2,400개로 충분

연구에서 가장 눈에 띄는 결과는 T2 방식의 효율성이다. 웹 검색 기능을 가진 AI를 만드는 실험에서, 기존 A2 방식으로 만든 'Search-R1'은 약 17만 개의 학습 샘플이 필요했다. 반면 T2 방식으로 만든 's3'는 단 2,400개의 샘플만으로 비슷한 성능(평균 정확도 58.9%)을 냈다. 학습에 필요한 데이터가 약 70분의 1로 줄어든 것이다. 훈련 시간도 약 33배 빠르다.

더 놀라운 건 일반화 능력이다. 일반적인 질문-답변 데이터로 훈련한 s3를 의료 분야 질문에 적용했더니 정확도 76.6%를 기록했다. 반면 Search-R1은 71.8%에 그쳤다. 전문 분야 데이터로 따로 훈련하지 않았는데도 더 좋은 성능을 보인 것이다. 이는 T2 방식이 더 범용적인 검색 능력을 학습한다는 것을 보여준다.

이렇게 효율이 높은 이유는 학습 범위가 다르기 때문이다. A2 방식은 AI가 도메인 지식, 도구 사용법, 작업별 추론을 동시에 배워야 한다. 반면 T2 방식은 고정된 AI가 이미 도메인 지식과 추론 능력을 갖추고 있다고 보고, 도구에게 '효과적인 검색'이라는 절차적 기술만 가르친다. 배워야 할 범위가 훨씬 좁으니 당연히 빠르고 효율적이다.

실제 서비스에 이미 적용 중... 오픈AI부터 의료까지

이런 학습 방법들은 이미 실제 서비스에 쓰이고 있다. 오픈AI의 'DeepResearch', 클로드의 딥서치 기능, 구글의 제미나이 기반 리서치 에이전트 같은 심층 연구 시스템이 대표적이다. 이들은 AI의 장문맥 추론과 가설 정제 능력을 강화하고(에이전트 적응), 문헌 데이터베이스나 웹 탐색 도구를 통합했다(도구 적응). DeepRetrieval과 s3 같은 학습 기반 검색 모듈이 실시간 정보 수집 정확도를 높인다.

소프트웨어 개발 분야에서는 커서(Cursor), 클로드 코드(Claude Code), 오픈AI의 코덱스(CodeX) 같은 서비스가 있다. 이들은 요구사항 해석부터 코드 생성, 디버깅, 테스팅, 배포까지 전체 개발 사이클을 자율적으로 처리한다. SWE-Agent는 워크플로 자율성과 디버깅 능력을 강화했고, SWE-Grep은 빠르고 정확한 코드 검색 기능을 제공한다.

컴퓨터 사용 분야에서는 오픈AI의 CUA(Computer-Using Agent)가 있다. 이 시스템은 화면을 시각적으로 인식하고 마우스와 키보드로 직접 컴퓨터를 조작한다. OpenCUA는 시각적 이해와 GUI 인식 능력을 훈련시켰고, ACE(Agentic Context Engineering)는 지속적 메모리와 컨텍스트 재생 기능을 개선했다.

신약 개발 분야도 활발하다. TrialMind는 의료 가이드라인과 임상시험 데이터베이스를 통합해 과학적 검증과 임상시험 설계를 지원한다. GeneAgent는 유전자 분석 작업에 적응했고, TrialGPT는 가이드라인 기반으로 환자-임상시험 매칭을 수행한다. 도구 측면에서는 SyntheMol이 ML 기반 분자 특성 예측기를 보상 함수로 활용하고, ToolUniverse는 자연어 명세서로부터 과학 도구를 생성하고 최적화한다.

FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. AI 에이전트 '적응'이 뭔가요?

A: AI를 특정 작업이나 환경에 맞게 조정하는 걸 말합니다. AI의 행동, 의사결정 전략, 내부 표현을 수정해서 성능을 높이는 과정입니다. 간단한 프롬프트 조정부터 파라미터를 직접 수정하는 파인튜닝까지 다양한 방법이 있습니다.

Q2. T2 방식이 왜 더 효율적인가요?

A: AI 본체는 그대로 두고 주변 도구만 훈련시키기 때문입니다. 고정된 AI가 이미 도메인 지식과 추론 능력을 갖추고 있어서, 도구는 검색이나 계획 같은 특정 절차적 기술만 학습하면 됩니다. 학습 범위가 좁아 훨씬 적은 데이터와 시간으로 가능합니다.

Q3. 이 기술이 어디에 쓰이나요?

A: 심층 연구, 소프트웨어 개발, 컴퓨터 자동화, 신약 개발 등 다양한 분야에서 쓰입니다. 오픈AI의 DeepResearch, 커서 같은 코딩 도구, 오픈AI의 CUA, TrialMind 같은 의료 AI 등이 모두 이런 적응 기술을 활용하고 있습니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문명: Adaptation of Agentic AI

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

독일차는 기본기 때문에 탄다더니 국산차 기본기는 중요하지 않다? 동영상 있음	오토기어
세상이 미쳤으니까 나도 극단적으로 간다! 시대를 무시한 최강 게이밍 PC 동영상 있음	집마 홀릭TV
칸의 돌풍, 영화 호프 경찰차 '스텔라'는 80년대 '부와 명예'의 상징 (1)	오토헤럴드
[모빌리티 인사이트] 공급망 재편 2라운드 돌입, 신규 변수는 '관세' (1)	오토헤럴드
[정석희의 기후 에너지 인사이트] 11. 200년 전 물리학이 겨울 난방에 던지는 질문	IT동아
호캉스 가고 단캉스가 온다, 라구나 푸껫 (1)	트래비
[숨신소] 확성기 독재자에 반항하는 퍼즐게임 '포노폴리스' (1)	게임메카
석 달째 횡보하는 PC시장 메모리 가격 하반기 메모리 모듈 가격의 향방은? 동영상 있음	보드나라
뻘짓연구소라는 테크 유튜버에 대해 말할 것이 있습니다.... 동영상 있음	THE EDIT
[겜덕연구소] 게임 표절과 복사.. 저작권 그게 뭐죠? 먹는 건가요? (1)	게임동아
SUV에 밀려 "죽었다" 사망 선고 받았던 '세단' 암흑기 끝내고 부활 조짐	오토헤럴드
[EV 트렌드] 기아, 유럽서 피칸토 단종 수순 '엔트리 EV 전략 본격화' (1)	오토헤럴드
日서 강력한 경쟁자 만난 '현대차 인스터' 심상치 않은 혼다 슈퍼원 돌풍 (1)	오토헤럴드
'판매 부진 털어낼 카드' 마세라티, 파리서 미래 담은 콘셉트카 예고	오토헤럴드
“F1 새 황제 키미 안토넬리" 캐나다 그랑프리 우승으로 4연승 질주	오토헤럴드
[인디言] 도트 '잇 테이크 투'를 꿈꾸는 팀 따코야끼	게임메카
[2026 플레이엑스포] PCIe 5.0 SSD 시대 선도하는 '키오시아'	미디어픽
[플레이엑스포 2026] 게임으로 그래픽 기술을 설명하다… PALIT과 이엠텍	위클리포스트
[2026 플레이엑스포] 게이밍 하드웨어의 새로운 가능성 제시한 '이엠텍아이엔씨'	미디어픽
[2026 플레이엑스포] 포유컴퓨터, AMD와 손잡고 붉은사막 체험존 선보여	미디어픽
[2026 플레이엑스포] 게이머 위한 혁신 제품 선보인 '에센코어 클레브'	미디어픽
[2026 플레이엑스포] 게임 산업과 소비자를 잇는 다리 '다나와 테크아레나'	미디어픽
[일러스타페스11] 더 매력적으로 진화하는 서브컬처 굿즈들	게임동아
[취재] 플레이엑스포와 일러스타페스11, 행사를 빛내준 코스플레이어들	게임동아
[취재] 이게 진짜 게임이지! '아케이드 게임'의 가능성을 쏜 플레이엑스포	게임동아
[일러스타페스11] 니벨아레나로 몰린 인파들.. "니케와 스텔라블레이드 콜라보는 못참지"	게임동아
[취재] 피크민과 한강 산책 즐기세요! 나이언틱 ‘피크민 블룸 저니 2026 서울’ 행사 개최	게임동아
[체험기] '신'이 되어 내 마음대로? 넷마블, '솔: 인챈트'	게임동아
[취재] 또 다른 국산 소울라이크 기대작! 노바플레어 ‘프로젝트 래빗’ 플레이엑스포에서 화제	게임동아
[취재] "잠실을 수놓은 메이플의 향연~" '메이플 어택! 위드 롯데' 가보니	게임동아
[르포] "좁은 집, 넓게 사는 법" 미니창고 다락, AIoT로 공간 경제 바꾼다	IT동아
“피지컬 AI 구현 방향을 고민하다” 어드밴텍 엣지 AI 솔루션 세미나	IT동아
‘도로 위 언어’ 노면 표시 의미 살펴보니	IT동아
카카오톡 교환권, 이제 가족·지인과 함께 쓴다···패밀리계정 직접 써보니	IT동아
플레이엑스포2026에서 만나본 GARAGE ARTS (게라지아츠)의 Oh! Robot: Legendary Mechanic - "애즈락 x 마이크로닉스"	브레인박스
게이머들에게 사랑받고 싶은 플레이엑스포 2026 클레브 (KLEVV) 부스	브레인박스
노트북 닫으세요, 구글 AI 에이전트가 24시간 일합니다 구글 I/0 2026 동영상 있음	AI matters
ROG 20년, ASUS가 PlayX4에 꺼내 든 ‘하이엔드 게이밍의 정수’	다나와
“그래픽카드는 브랜드 보고 산다”… 이엠텍, PlayX4서 팔릿의 이유를 보여주다	다나와
엑스지미, 플레이엑스포서 ‘TV보다 큰 축구장’ 펼쳤다… FC26 대화면 게이밍 체험 눈길	다나와
“독거미 키보드부터 잠자리 마우스까지”…펀키스, 플레이엑스포서 게이밍 기어 총공세	다나와
‘화면 달린 쿨러’가 시선 잡았다…얼티메이크, 플레이엑스포서 PCCOOLER 빌드 전략 공개 (1)	다나와
게임 보러 왔다가 PC까지 꽂혔다… HP, 플레이엑스포서 게이밍·AI PC 존재감 과시	다나와
“게임하러 왔다가 SSD까지 바꾼다”…키오시아가 플레이엑스포서 꺼낸 ‘낸드 원조’의 자신감	다나와
일론 머스크도 다 못 읽었을 스페이스X 500P 상장 신청서, 10분 만에 끝내기 \| 노트북LM 활용 (1) 동영상 있음	AI matters
게이머들와 친해지기, 마이크로닉스 2026년 라인업 부스 - 플레이엑스포 2026	브레인박스
[정보/루머] 효율 챙기며 가성비 시장 공략 나선 인텔과 AMD, 지포스 놓고 애매한 입장 취하는 엔비디아 등 (1)	다나와
[취재] 포가튼사가, 컬드셉트. 플레이엑스포에서 추억의 게임으로 화제된 대원미디어	게임동아
"현대는 절대 테슬라 못 따라간다?" SDV가 정확히 뭐길래? 동영상 있음	오토기어
대원미디어, 세상에 없던 '버그 없는 포가튼사가' 만든다	게임메카
플레이엑스포에서 만난 SANDISK, “옵티머스로 SSD 시장 다시 리드한다”	다나와
플레이엑스포 한복판에서 KLEVV의 체감 성능 승부!	다나와
플레이엑스포에서 만나볼 수 있었던 엔비디아 지포스 RTX 시리즈 - 이엠텍 부스	브레인박스
[김훈기 칼럼] 'SDV 다음은 AIDV' 완성차 업계, 수익 모델 찾아 총성 없는 전쟁 (1)	오토헤럴드
[EV 트렌드] "유가 폭등이 당겼다" 전기차, '에너지 안보 자산'으로 급부상 (1)	오토헤럴드
[순정남] 경영진이 정신 나간 게임 속 '막장' 기업 TOP 5	게임메카
[취재] 미래를 맛보는 플레이엑스포 ‘XR 센트럴 스테이션’, 애플 비전프로·햅틱 슈트 총출동!	게임동아
벤츠ㆍBMW 산다던 3명 중 1명 기아로... '결정 직전 기묘한 변심'	오토헤럴드
[EV 트렌드] 현대차·기아, 엔트리 EV 공동 개발 '보급형 전기차 확대' (1)	오토헤럴드
차값보다 무서운 기름값 '전기차 vs 가솔린' 격차 3년 새 41.7% 급등	오토헤럴드
김영준 파블로항공 의장·한국항공대 혁신융합대학 사업단 특강 ‘K-드론의 미래’ 제시	IT동아
제미나이 3.5 플래시·자체 반도체로 무장한 구글, AI 주도권 탈환 나선다 (1)	IT동아
[월간자동차] 26년 4월, 테슬라 ‘모델 Y’ 1만대 이상 판매 (1)	IT동아
"손목 위 코치" 서울시청 철인3종팀의 GPS 활용법	IT동아
샌디스크, 독립 경영 출범 이후 첫 신제품 기자간담회 개최... 옵티머스 SSD·FIFA 월드컵 에디션 공개	케이벤치
결국 무너진 애플... 맥미니 기본형 삭제, 맥북 네오까지 위기인 이유 동영상 있음	주연 ZUYONI
밀라노에서 베네치아 기차로 가는 방법, 이딸로&트렌이탈리아 가이드	트래비
한국인들이 아직 잘 모르는 홍콩 사진 스폿 5	트래비
소비자 중심의 철학과 신뢰를 이어간다, 샌디스크 신제품 출시 기자간담회	블루프레임
연인과 함께 가면 좋은 이탈리아 로마 맛집 3	트래비
챗GPT 1위는 그대로인데 클로드 사용자가 1년 새 12배 폭증한 이유	AI matters
[겜ㅊㅊ] 고생 끝에 낙이 온다, 소울라이크 신작 5선	게임메카
일론 머스크 말 믿고 호수에 뛰어든 사이버트럭 운전자 '비극적 결말' (1)	오토헤럴드
[EV 트렌드] 볼보, 미국서 EX30 돌연 철수 '대체할 보급형 전기차 준비'	오토헤럴드
[모빌리티 인사이트] BMW도 현대차도 AI 넣는데 '진짜 돈 되는 건 아직'	오토헤럴드
세계에서 ‘가장 비싼 와인’을 위조한 남자	마시즘
메모리 폭등 시대 더 비싼 삼성 시금치 메모리, 돈 더 주면서 계속 써야할까? 이제는 놓아줄 때가 되었다 동영상 있음	보드나라
IBM, 양자 중심 슈퍼컴퓨팅 시대 예고…“올해 양자 우위 입증할 것”	IT동아
"AI 많이 쓰면 일잘러?" 빅테크 흔드는 '토큰맥싱' 열풍	IT동아
[위클리AI] "성능 경쟁 끝났다" 앤트로픽부터 메타까지 글로벌 빅테크 신뢰 전쟁 돌입	IT동아
유아이패스 "업무 자동화용 에이전틱 AI, 이제는 '진짜 쓸모' 따질 때"	IT동아
[자동차와 法] 소프트웨어 중심 자동차 시대…바퀴 달린 컴퓨터 맞이하는 낡은 법의 한계	IT동아
'치솟는 원가에 무너진 수익 방어선' 글로벌 완성차 가격 딜레마	오토헤럴드
아시아 모터스포츠 카니발 영암 격돌, 시즌 유일 피트스톱 레이스 관심	오토헤럴드
[EV 트렌드] BMW도 결국 엔트리 EV '젊은 고객 잡기 본격화'	오토헤럴드
RX6000 구형 라데온까지 최신 FSR4.1 지원? 역시 AMD 믿고 있었다구! 동영상 있음	민티저
무려 76도까지 치솟는 BYD 12C 충전 "수명? 안전? 이딴 건 상관 없어!" 동영상 있음	오토기어
소니 A7R6·캐논 R6 V로 보는 시장 현황, 가격경쟁력보다 '전문가 눈높이' 맞춰	IT동아
[숨신소] 고전 젤다와 성검전설의 만남, 알라바스터 던 (1)	게임메카
“갤럭시 Z 폴드8 배터리 커진다?” 애플워치·PS5·원플러스까지 이번 주 루머 총정리	다나와
필요한 게 많은 사무용 PC를 위해. 라이젠 5 프로 8500G/8600G	기글하드웨어
지금 S26울트라 사면 후회합니다;; S27 '작트라' 역대급 유출 스펙 총정리 (1) 동영상 있음	주연 ZUYONI
신혼부부와 연인을 위한 베네치아 럭셔리 여행법 (1)	트래비
[판례.zip] 인터넷 방송인에 귓말로 욕해도 모욕죄 성립 가능 (1)	게임메카
서브노티카 2 개발자 "함께 해도 심해 고립감은 여전할 것"	게임메카
자율주행차의 ‘눈’이 바뀐다, 신호등 '色' 읽는 네이티브 컬러 라이다 등장	오토헤럴드
메르세데스 AMG, 뉘르 24시 10년 만의 정상 탈환... 현대차 N 완주	오토헤럴드
현대 N, 뉘르부르크링 24시 완주…TCR 6연패와 신형 엔진 내구성 입증	오토헤럴드
[EV 트렌드] 테슬라 스마트 서먼 성능 개선 '차량 호출 속도 33% 향상'	오토헤럴드
[르포] 크리에이터와 팬, AI가 만난 축제의 장 ‘유튜브 팬페스트 코리아 2026’	IT동아

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

하버드·스탠포드 등 연구팀, AI 에이전트 ‘적응’ 기술 제시… "본체 고정·도구만 훈련해 학습 효율 70배 향상”

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

하버드·스탠포드 등 연구팀, AI 에이전트 ‘적응’ 기술 제시… "본체 고정·도구만 훈련해 학습 효율 70배 향상”

공유하기

공감/비공감