비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

알리바바, 스스로 암기·삭제하는 AI 개발... 기존보다 성능 49% 향상

2026.01.16. 10:21:16
조회 수
180
3

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

대화형 AI가 사람처럼 중요한 정보는 기억하고 불필요한 정보는 잊어버리는 기술이 개발됐다. 알리바바와 중국 우한대학교 연구팀은 AI가 스스로 무엇을 저장하고 삭제할지 결정하는 '에이전틱 메모리(Agentic Memory, AgeMem)' 시스템을 개발했다. 해당 연구 논문에 따르면, 이 기술은 기존 방식보다 최대 49% 더 나은 성능을 보였다.

AI 기억력의 한계, 새로운 방식으로 돌파

지금까지 대화형 AI는 한 번에 처리할 수 있는 정보량이 제한되어 있었다. 긴 대화나 복잡한 작업을 할 때 앞에서 나눈 이야기를 잊어버리는 문제가 발생했다. 기존 연구들은 장기 기억과 단기 기억을 따로따로 관리했다. 이 방식은 미리 정해진 규칙에 따라 움직여서 상황에 맞춰 유연하게 대응하기 어려웠다.

연구팀이 만든 에이전틱 메모리는 AI에게 6가지 기억 관리 도구를 제공한다. AI는 이 도구들을 스스로 선택해서 사용할 수 있다. 장기 기억 관리를 위해서는 새로운 정보를 추가하는 'ADD', 저장된 정보를 수정하는 'UPDATE', 불필요한 정보를 삭제하는 'DELETE' 도구가 있다. 단기 기억 관리를 위해서는 저장된 정보를 꺼내 오는 'RETRIEVE', 대화 내용을 요약하는 'SUMMARY', 관련 없는 내용을 걸러내는 'FILTER' 도구가 있다.

기존 시스템들은 장기 기억과 단기 기억을 별도로 관리하고 나중에 연결했다. 에이전틱 메모리는 처음부터 두 가지 기억을 하나로 묶어서 관리한다. AI가 상황을 보고 어떤 도구를 언제 사용할지 스스로 판단한다.


3단계 학습법으로 기억 관리 능력 키워

연구팀은 AI에게 기억 관리 방법을 가르치기 위해 3단계 학습 방법을 개발했다.

1단계에서는 AI가 일상적인 대화를 나누면서 중요한 정보를 장기 기억에 저장하는 법을 배운다. 2단계에서는 AI에게 관련 없는 잡다한 정보를 주입한다. AI는 필요 없는 정보를 걸러내고 중요한 정보만 단기 기억에 남기는 연습을 한다. 3단계에서는 실제 문제를 풀면서 저장했던 장기 기억과 정리한 단기 기억을 함께 활용하는 법을 익힌다.

여기서 핵심은 1단계에서 저장한 장기 기억이 2단계와 3단계에서도 계속 유지된다는 점이다. 반면 단기 기억은 1단계가 끝나면 초기화된다. 이렇게 해야 AI가 앞 단계의 정보를 그냥 기억하는 게 아니라, 제대로 저장하고 꺼내 쓰는 법을 배울 수 있다.

연구팀은 AI가 학습할 때 최종 결과를 앞 단계의 모든 행동과 연결했다. 마지막에 문제를 잘 풀었다면, 1단계에서 정보를 잘 저장한 것도 칭찬받고, 2단계에서 불필요한 정보를 잘 걸러낸 것도 칭찬받는다. 반대로 실패하면 모든 단계의 행동이 함께 교정된다.

AI의 학습 성과를 측정하기 위해 세 가지 항목을 평가했다. 첫째, 문제를 제대로 해결했는가. 둘째, 대화 내용을 효율적으로 관리했는가. 셋째, 가치 있는 정보를 장기 기억에 잘 저장했는가. 이 세 가지를 모두 고려해서 AI를 훈련시켰다.

5개 테스트 평균 성능 1위...기존 시스템 모두 제쳐

연구팀은 개발한 시스템을 5가지 다른 과제로 시험했다. ALFWorld(가상 환경에서 집안일하기), SciWorld(과학 실험하기), PDDL(계획 세우기), BabyAI(지시 따르기), HotpotQA(여러 단계 거쳐 질문 답하기) 등이다. 해당 시험은 두 가지 AI 모델(Qwen2.5-7B-Instruct, Qwen3-4B-Instruct)로 테스트했다.

평균 성능에서 모든 기존 방식을 앞섰다. Qwen2.5-7B 모델에서 에이전틱 메모리는 평균 41.96%의 성공률을 기록했다. 기억 기능이 없는 일반 AI는 28.05%에 그쳤다. 약 49% 더 나은 성능이다. Qwen3-4B 모델에서는 54.31%로, 일반 AI의 43.97%보다 약 24% 향상됐다.

기존의 다른 기억 시스템들(LangMem, A-Mem, Mem0)과 비교해도 에이전틱 메모리가 가장 우수했다. 가장 좋은 기존 시스템보다 4.82~8.57%포인트 더 높은 점수를 받았다.

저장된 정보의 품질도 측정했다. Qwen2.5-7B 모델에서 0.533점, Qwen3-4B 모델에서 1점 만점 중 0.605점을 받았다. 기존 시스템들보다 훨씬 높은 점수다. 이는 AI가 정말 중요한 정보를 선별해서 저장한다는 뜻이다.

대화 내용 관리 능력도 확인했다. 에이전틱 메모리는 기존 방식보다 사용하는 정보량을 3~5% 줄였다. 불필요한 내용을 잘 걸러내서 효율적으로 작동한 것이다.

학습 전후 비교했더니 도구 사용법 제대로 익혔다

AI가 정말 도구 사용법을 배웠는지 확인하기 위해 학습 전후를 비교했다. 학습 전에는 ADD(정보 추가) 도구를 대화당 평균 0.92번 사용했다. 학습 후에는 1.64번으로 늘었다. UPDATE(정보 수정) 도구는 학습 전에는 거의 사용하지 않았지만, 학습 후에는 0.13번 사용했다.

단기 기억 도구 사용도 균형을 찾았다. FILTER(불필요한 정보 걸러내기) 사용이 0.02번에서 0.31번으로 크게 늘었다. AI가 상황에 맞춰 적극적으로 정보를 관리하기 시작한 것이다.

연구팀은 장기 기억과 단기 기억을 따로 관리할 때와 함께 관리할 때를 비교했다. 장기 기억만 추가했을 때보다, 단기 기억 관리를 함께하면 성능이 더 올랐다. 특히 SciWorld에서는 3.1%포인트, HotpotQA에서는 2.4%포인트 추가 향상이 있었다. 두 가지 기억을 통합 관리하는 것이 확실히 효과적이라는 증거다.

FAQ (※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. 에이전틱 메모리는 기존 AI와 어떻게 다른가요?

A: 기존 AI는 정보를 저장하고 꺼내는 방법이 미리 정해져 있었습니다. 프로그래머가 만든 규칙에 따라 움직였죠. 에이전틱 메모리는 AI가 스스로 판단합니다. 지금 이 정보가 중요한지, 나중에 필요할지, 아니면 지금 당장만 쓸 건지를 AI가 결정합니다. 마치 사람이 중요한 약속은 메모장에 적고, 덜 중요한 건 그냥 머릿속에만 담아두는 것처럼요.

Q2. 3단계 학습은 어떻게 진행되나요?

A: 1단계는 정보 수집 단계입니다. AI가 대화를 나누며 중요한 정보를 골라 저장합니다. 2단계는 정보 정리 단계입니다. 쓸모없는 정보가 섞여 들어오면, AI는 진짜 필요한 것만 남기고 나머지는 버립니다. 3단계는 실전 단계입니다. 저장했던 정보를 꺼내고, 정리한 내용을 활용해서 실제 문제를 풉니다. 마지막 결과가 좋으면 앞 단계의 모든 선택이 칭찬받고, 나쁘면 모두 개선됩니다.

Q3. 어디에 활용할 수 있나요?

A: 긴 대화를 나눠야 하는 곳이면 어디든 유용합니다. 고객 상담 챗봇이 손님의 과거 문의 내역을 기억하고 맞춤 답변을 할 수 있습니다. 교육 보조 AI는 학생의 학습 스타일과 약한 부분을 기억해서 개인별 커리큘럼을 만들어줄 수 있습니다. 개인 비서 AI는 사용자의 선호도와 일정을 기억해서 더 정확한 제안을 할 수 있습니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문명: Agentic Memory: Learning Unified Long-Term and Short-Term Memory Management for Large Language Model Agents

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.





AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
EU 이사회, AI 법 간소화 합의… 비동의 성적 딥페이크 생성 AI 명시적 금지 AI matters
백악관, AI 규제 프레임워크 발표 임박… '4C' 핵심 의제로 부상 AI matters
마이크로소프트, 코파일럿 AI 리더십 대거 개편… 술레이만은 신모델 개발 집중 AI matters
구글, 맥용 제미나이 앱 비공개 테스트 돌입… 챗GPT·클로드 대항마로 AI matters
빛으로 빚은 BMW의 얼굴, 크롬을 지우고 미래를 채우다 글로벌오토뉴스
아는 만큼 즐긴다. ‘붉은사막’ 플레이 전에 알아야 할 점들은? 게임동아
'일곱 개의 대죄: 오리진' 해보니, 그랜드 론칭 기대감 UP 게임동아
엠게임 2026 비전 발표회 개최. 신성장 위한 준비 구체화 게임동아
넷마블 '킹 오브 파이터 AFK'에 의적단 두목 'B. 제니' 업데이트 게임동아
리비안·우버, R2 기반 로보택시 동맹 '2028년 상용화' 목표 오토헤럴드
토요타, 센추리 전용 쇼룸 도쿄에 첫 개설 '독립 브랜드 전략' 가속 오토헤럴드
KGM, 현장 적용형 AI 휴머노이드 로봇 투입으로 생산 현장 혁신 가속 오토헤럴드
벤츠, C 클래스 전기 세단 공개 임박 '실패한 EQ 전략의 수정 무대' 오토헤럴드
기아 82기 주총, EV·PBV·SDV 3축 전략 '전자 주총·집중투표제' 도입 오토헤럴드
글로벌 역풍 속 한국만의 역주행, 포르쉐코리아 세계 5위 시장으로 글로벌오토뉴스
엔비디아, GTC 2026서 자율주행 영토 확장… 현대차·우버 등 글로벌 동맹 강화 글로벌오토뉴스
메르세데스 벤츠, 중국 지리자동차와 차세대 전기차 플랫폼 협력 논의… 피닉스 프로젝트 가동 글로벌오토뉴스
미국 라이텐, 노스볼트 독일 부지 인수 확정… 2028년 배터리 양산 및 1,000명 고용 글로벌오토뉴스
현대오토에버-톰톰, 유럽서 매달 지도 업데이트 서비스 글로벌오토뉴스
아마존 엔비디아, 차량용 멀티모달 AI 비서 공동 개발… 2027년 초 상용 테스트 돌입 글로벌오토뉴스
이 시간 HOT 댓글!
1/4