비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

하버드·스탠포드 등 연구팀, AI 에이전트 ‘적응’ 기술 제시… "본체 고정·도구만 훈련해 학습 효율 70배 향상”

2025.12.24. 19:07:07
조회 수
197
10

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

AI가 점점 더 복잡한 일을 하게 되면서, AI를 특정 작업에 맞게 조정하는 '적응' 기술이 중요해지고 있다. 미국 일리노이대학교, 스탠포드대학교, 프린스턴대학교 등 14개 연구 기관이 공동으로 발표한 논문에 따르면, AI 에이전트를 효율적으로 학습시키는 4가지 방법을 정리했다. 특히 'AI 본체를 고정하고 주변 도구만 훈련시키는' 방식이 기존 방법보다 70배 적은 데이터로 같은 성능을 낼 수 있다는 점이 주목받고 있다.

AI 학습법 4가지로 나눴다... 핵심은 '무엇을' '어떻게' 훈련시키느냐

연구진은 AI 에이전트 학습 방법을 크게 두 가지 기준으로 나눴다. 첫 번째는 'AI 본체를 훈련시키는 방법'이고, 두 번째는 'AI가 사용하는 도구를 훈련시키는 방법'이다. 이를 다시 세부적으로 나누면 총 4가지 방법이 나온다.

AI 본체를 훈련시키는 방법은 두 가지다. 'A1 방식'은 AI가 사용한 도구의 실행 결과를 보고 학습한다. 예를 들어 코드를 실행했을 때 제대로 작동했는지, 검색 결과가 관련성이 높은지 등을 확인하며 배운다. 'A2 방식'은 AI가 내놓은 최종 답변의 정확성이나 품질을 평가받아 학습한다.

도구를 훈련시키는 방법도 두 가지다. 'T1 방식'은 AI 본체와 상관없이 검색기, 계획기 같은 도구를 독립적으로 훈련시킨다. 훈련된 도구는 어떤 AI에도 붙여서 사용할 수 있다. 'T2 방식'은 AI 본체를 그대로 두고, 그 AI의 출력 신호를 활용해 도구만 훈련시킨다. 고정된 AI가 제공하는 피드백을 바탕으로 도구가 발전하는 방식이다.


학습 데이터 70분의 1로 줄였다... 훈련 샘플 2,400개로 충분

연구에서 가장 눈에 띄는 결과는 T2 방식의 효율성이다. 웹 검색 기능을 가진 AI를 만드는 실험에서, 기존 A2 방식으로 만든 'Search-R1'은 약 17만 개의 학습 샘플이 필요했다. 반면 T2 방식으로 만든 's3'는 단 2,400개의 샘플만으로 비슷한 성능(평균 정확도 58.9%)을 냈다. 학습에 필요한 데이터가 약 70분의 1로 줄어든 것이다. 훈련 시간도 약 33배 빠르다.

더 놀라운 건 일반화 능력이다. 일반적인 질문-답변 데이터로 훈련한 s3를 의료 분야 질문에 적용했더니 정확도 76.6%를 기록했다. 반면 Search-R1은 71.8%에 그쳤다. 전문 분야 데이터로 따로 훈련하지 않았는데도 더 좋은 성능을 보인 것이다. 이는 T2 방식이 더 범용적인 검색 능력을 학습한다는 것을 보여준다.

이렇게 효율이 높은 이유는 학습 범위가 다르기 때문이다. A2 방식은 AI가 도메인 지식, 도구 사용법, 작업별 추론을 동시에 배워야 한다. 반면 T2 방식은 고정된 AI가 이미 도메인 지식과 추론 능력을 갖추고 있다고 보고, 도구에게 '효과적인 검색'이라는 절차적 기술만 가르친다. 배워야 할 범위가 훨씬 좁으니 당연히 빠르고 효율적이다.

실제 서비스에 이미 적용 중... 오픈AI부터 의료까지

이런 학습 방법들은 이미 실제 서비스에 쓰이고 있다. 오픈AI의 'DeepResearch', 클로드의 딥서치 기능, 구글의 제미나이 기반 리서치 에이전트 같은 심층 연구 시스템이 대표적이다. 이들은 AI의 장문맥 추론과 가설 정제 능력을 강화하고(에이전트 적응), 문헌 데이터베이스나 웹 탐색 도구를 통합했다(도구 적응). DeepRetrieval과 s3 같은 학습 기반 검색 모듈이 실시간 정보 수집 정확도를 높인다.

소프트웨어 개발 분야에서는 커서(Cursor), 클로드 코드(Claude Code), 오픈AI의 코덱스(CodeX) 같은 서비스가 있다. 이들은 요구사항 해석부터 코드 생성, 디버깅, 테스팅, 배포까지 전체 개발 사이클을 자율적으로 처리한다. SWE-Agent는 워크플로 자율성과 디버깅 능력을 강화했고, SWE-Grep은 빠르고 정확한 코드 검색 기능을 제공한다.

컴퓨터 사용 분야에서는 오픈AI의 CUA(Computer-Using Agent)가 있다. 이 시스템은 화면을 시각적으로 인식하고 마우스와 키보드로 직접 컴퓨터를 조작한다. OpenCUA는 시각적 이해와 GUI 인식 능력을 훈련시켰고, ACE(Agentic Context Engineering)는 지속적 메모리와 컨텍스트 재생 기능을 개선했다.

신약 개발 분야도 활발하다. TrialMind는 의료 가이드라인과 임상시험 데이터베이스를 통합해 과학적 검증과 임상시험 설계를 지원한다. GeneAgent는 유전자 분석 작업에 적응했고, TrialGPT는 가이드라인 기반으로 환자-임상시험 매칭을 수행한다. 도구 측면에서는 SyntheMol이 ML 기반 분자 특성 예측기를 보상 함수로 활용하고, ToolUniverse는 자연어 명세서로부터 과학 도구를 생성하고 최적화한다.

FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. AI 에이전트 '적응'이 뭔가요?

A: AI를 특정 작업이나 환경에 맞게 조정하는 걸 말합니다. AI의 행동, 의사결정 전략, 내부 표현을 수정해서 성능을 높이는 과정입니다. 간단한 프롬프트 조정부터 파라미터를 직접 수정하는 파인튜닝까지 다양한 방법이 있습니다.

Q2. T2 방식이 왜 더 효율적인가요?

A: AI 본체는 그대로 두고 주변 도구만 훈련시키기 때문입니다. 고정된 AI가 이미 도메인 지식과 추론 능력을 갖추고 있어서, 도구는 검색이나 계획 같은 특정 절차적 기술만 학습하면 됩니다. 학습 범위가 좁아 훨씬 적은 데이터와 시간으로 가능합니다.

Q3. 이 기술이 어디에 쓰이나요?

A: 심층 연구, 소프트웨어 개발, 컴퓨터 자동화, 신약 개발 등 다양한 분야에서 쓰입니다. 오픈AI의 DeepResearch, 커서 같은 코딩 도구, 오픈AI의 CUA, TrialMind 같은 의료 AI 등이 모두 이런 적응 기술을 활용하고 있습니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문명: Adaptation of Agentic AI

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 기획뉴스 전체 둘러보기
4/1
이거 국가 망신 아닌가요? 중국도 안 할 짓을 국토부가? 황당한 KNCAP의 결과? 동영상 있음 오토기어
아바타 3 속 메두소이드는 허구일까? 과학향기
국내 No.1 브랜드 여기 다 모였네....2025 하반기 다나와 히트브랜드 시상식 미디어픽
2026년 출시 예정 삼성 갤럭시 & 애플, 주목할 신제품 12가지 (10) 다나와
[12월 24일 AI 뉴스 브리핑] RECORD X, AI 제작 다큐 '트랜스휴먼' 방송 콘텐츠 대상 수상 외 AI matters
선 긋고 사진 넣고 한 줄 쓰면 영상 완성... 그림판처럼 쉬운 AI 영상 제작 기술 등장 (1) AI matters
하버드·스탠포드 등 연구팀, AI 에이전트 ‘적응’ 기술 제시… "본체 고정·도구만 훈련해 학습 효율 70배 향상” AI matters
아직도 안 갈아타셨나요? 챗GPT에서 Gemini로 이사하는 빠르고 합리적인 방법 총정리 (feat. LG U+) 동영상 있음 조코딩 JoCoding
성능과 혁신으로 CPU의 새 역사 써내려간 'AMD 라이젠 프로세서' 미디어픽
뜨거웠던 '아시아 퍼시픽 프레데터 리그'....에이서 PC 및 모니터로 현장 열기 UP!! 미디어픽
정의선 철학 "안전하고 편안한 이동의 자유" 현대차ㆍ기아, 결과로 증명 오토헤럴드
‘5G SA 의무화 쟁점’…이동통신 주파수 재할당 정책, 업계에 미칠 영향은? IT동아
삼성전자 하만의 ZF ADAS 사업부 인수는 '자동차 두뇌에 던진 승부수' 오토헤럴드
마모 상태 체크하는 타이어, 미쉐린 ‘스마트웨어’가 바꾸는 안전 기준 오토헤럴드
서울의 겨울밤이 빛나는 이유: 2025 서울빛초롱축제&광화문 마켓 트래비
[BOOK] 돈가스 박사가 만든, 돈가스 대돈여지도 (1) 트래비
베트남 세 도시에서 찾은 문화유산, 그리고 지속가능한 여행 트래비
2025 하반기 다나와 히트 브랜드 탐방기 쿨엔조이
서든∙블아로 다진 내실, 넥슨게임즈 신작으로 비상 준비 게임메카
[위클리AI] 오픈AI 챗GPT 이미지 공개에 구글 제미나이3 플래시 출시까지 '각축전' IT동아
이 시간 HOT 댓글!
1/4