AI도 기억을 헷갈린다...대형언어모델의 '지식 충돌' 현상 분석 : 다나와 DPG는 내맘을 디피지

Knowledge Conflicts for LLMs: A Survey

칭화대학교와 케임브리지대학교 공동 연구팀이 발표한 최신 연구에 따르면, 대형언어모델(LLM)이 지식을 처리하는 과정에서 세 가지 유형의 '지식 충돌' 현상이 발생하는 것으로 나타났다. 이러한 충돌은 특히 실제 응용 환경에서 노이즈와 잘못된 정보가 흔한 상황에서 모델의 신뢰성과 성능에 큰 영향을 미치는 것으로 밝혀졌다.

진실과 거짓 사이에서 혼란스러운 AI, 지식충돌의 주요 원인

대형언어모델의 지식충돌은 시간적 불일치와 잘못된 정보 오염이라는 두 가지 주요 원인에서 비롯된다. 시간적 불일치는 과거 데이터로 학습된 모델이 현재의 정보와 맞지 않을 때 발생하는데, 이는 모델의 사전학습 패러다임과 모델 확장에 따른 비용 증가로 인해 더욱 심화될 것으로 예상된다. 잘못된 정보로 인한 오염의 경우, 검색된 문서나 사용자 대화에서 의도적으로 조작된 정보가 유입될 때 발생하며, 실험 결과 모델의 성능을 최대 87%까지 저하시키는 것으로 나타났다.

세 갈래로 나뉜 AI의 혼란: 문맥, 정보, 기억의 충돌

대형언어모델의 지식충돌은 크게 문맥-기억 충돌(Context-Memory Conflict), 문맥간 충돌(Inter-Context Conflict), 내부기억 충돌(Intra-Memory Conflict)로 구분된다. 문맥-기억 충돌은 모델의 파라미터에 저장된 지식과 외부에서 주입되는 문맥 정보가 상충할 때 발생한다. 문맥간 충돌은 검색 증강 생성(RAG) 기술 사용 시 검색된 여러 문서들 사이의 정보가 서로 모순될 때 발생하며, 실험 결과 잡음률이 0.8을 초과하면 모든 모델의 성능이 20% 이상 감소했다. 내부기억 충돌은 모델 내부의 지식 표현이 서로 일관되지 않을 때 발생하는 현상이다.

충돌하는 정보 앞에서 AI의 선택은 제각각

실험 결과는 모델들의 행동 패턴이 매우 다양함을 보여줬다. ChatGPT, GPT-4, PaLM2는 모델에 내재된 지식을 선택할 확률이 60% 이상이었으나, 다른 모델들은 주어진 문맥 정보를 80% 이상 선택했다. 특히 대화가 진행되면서 AI의 믿음 체계 변화 비율은 20.7%에서 78.2%까지 증가했다. 더욱 우려되는 점은 GPT-4조차도 FaVIQ 테스트에서 32%의 불일치율을 보였다는 것이다.

"거짓말을 하고 있어요": AI의 자체 모순 감지 능력

모델의 자체 모순 탐지 능력도 평가되었다. GPT-4는 문서 내 모순을 발견할 확률이 70% 이상으로 가장 우수했으나, 다른 모델들은 50% 미만의 성능을 보였다. CONTRADOC 데이터셋을 통한 실험에서는 감정이나 주관적 관점이 포함된 내용, 문서의 길이나 자기모순의 다양성이 모순 탐지 성능에 영향을 미치는 것으로 나타났다.

AI의 혼란을 잡아라: 지식충돌 해결을 위한 세 가지 전략

연구팀은 문제 해결을 위해 '문맥 충실', '잘못된 정보 식별', '정보 원천 분리' 세 가지 주요 전략을 제시했다. 문맥 충실 전략을 적용한 GPT-Neo 20B는 MemoTrap에서 54.4%, NQ-SWAP에서 128%의 성능 향상을 보였다. ChatGPT의 경우 프롬프트 기반 해결책 적용 시 MRC 태스크에서 32.2%, Re-TACRED에서 10.9%의 개선효과가 있었다. 특히 지식충돌 감지 시스템은 80%의 F1 점수를 달성했다.

멀티모달 시대의 새로운 과제: AI 지식충돌의 미래

연구진은 실제 환경의 지식충돌, 다국어 환경에서의 충돌, 멀티모달 데이터 간 충돌을 주요 과제로 지목했다. 특히 이미지(Alayrac et al., 2022), 비디오(Ju et al., 2022), 오디오(Borsos et al., 2023) 등 다양한 형태의 정보가 결합될 때 발생하는 복잡한 충돌 문제 해결이 시급하다고 강조했다. 또한 통합적이고 효율적인 해결책 개발의 필요성도 제기되었다.

해당 리포트의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

오버워치 x 요아소비 컬래버 음원 '오리온' 공개	게임메카
SOOP, 텐센트와 슈팅게임 '델타포스' e스포츠 협력 확대	게임동아
엘리멘타 '실버 팰리스', 2차 테스트 참가자 모집	게임동아
정부의 정보 검열과 감시에 맞서 싸운 게임 속 영웅들 (1)	게임동아
도깨비의 이야기를 파는 개발팀. '망량기담' 개발한 '망량상회'	게임동아
숨바꼭질 게임 '멧챠 카멜레온' 순식간에 1,000만 장 판매	게임메카
제네시스, 부산모빌리티쇼서 마그마 GT 콘셉트·GMR-001 하이퍼카 아시아 최초 공개 (1)	글로벌오토뉴스
기아, 부산모빌리티쇼서 PV5 신규 라인업 및 맞춤형 협업 모델 대거 공개 (1)	글로벌오토뉴스
현대차, 부산모빌리티쇼서 8세대 완전변경 ‘디 올 뉴 아반떼’ 세계 최초 공개	글로벌오토뉴스
차봇모터스, 부산모빌리티쇼서 이네오스 그레나디어 홍보대사 이대호와 포토세션 진행	글로벌오토뉴스
BMW 그룹 코리아, 부산모빌리티쇼서 한정판 7시리즈 등 총 13종 라인업 출격	글로벌오토뉴스
BYD코리아, 부산모빌리티쇼서 전기차 기반 하이브리드 ‘씨라이언 6 DM-i’ 최초 공개	글로벌오토뉴스
현대차 호세 무뇨스 사장 “엔트리 고객이 평생 고객으로… 모빌리티 본연에 충실할 것”	글로벌오토뉴스
위메이드 '레전드 오브 이미르' 두 번째 국제 대회, 27일 개최	게임메카
"성의 없는 우려먹기" DOA 6 완전판 평가 '대체로 부정적' (1)	게임메카
SOOP, 텐센트와 FPS '델타 포스' e스포츠 협력 확대	게임메카
"데스티니 2 접은 이유가?" 소니 , 번지 스튜디오 292명 감축	게임동아
시라노 번스타인 출격! '창세기전 키우기' 서비스 100일 기념 업데이트	게임동아
엑스박스 콘솔 가격 또 오른다.. "2TB 모델은 단종"	게임동아
"발더스3, 스텔라블레이드, 콜옵"... 스팀 여름 할인 돌입!	게임동아
‘에픽세븐’, 여름 업데이트 시작… 한정 영웅 ‘심해의 눈 후미르’ 등장	게임동아
'킹덤 컴: 딜리버런스 2’, 전 세계 판매량 600만 장 돌파	게임동아
‘그랜드체이스 클래식’, 스토브에서 사전 등록 시작한다	게임동아
넷마블, '일곱 개의 대죄: 오리진'에 '엘리자베스' 등장! 100뽑기도 증정	게임동아
어디까지 버틸 수 있나요? 영역 확장하며 버티는 생존 게임 '코드램프'	게임동아
음식 소비기한 표시된다, 넥슨 신작 '낙원' 개발 현황 공개	게임메카
Xbox마저, 시리즈 X/S 가격 인상 및 2TB 모델 단종	게임메카
아트·시스템 전면 개편, 프리스타일 리마스터 나온다	게임메카
CL 4년 연속 정상, 디플러스 기아 아시아 마스터즈 우승	게임메카
룬테라가 카드로, 롤 TCG '리프트바운드' 9월 국내 출시	게임메카
SOOP, MSI 2026 다국어 중계 및 오프라인 행사 연다	게임메카
F1 턱밑까지 추격하는 포뮬러 E, 새 시즌 Gen4 도입과 대대적 개편	글로벌오토뉴스
포르쉐, 지나치게 늘어난 라인업 줄이고 스포츠카 DNA 집중	글로벌오토뉴스
폭스바겐, 전기차 배터리 전력망에 판매하는 V2G 양산화	글로벌오토뉴스
토요타, 중동 전쟁과 호르무즈 봉쇄로 해외 생산 10만 대 감산 돌입	글로벌오토뉴스
푸조, 르망 24시간 레이스 데뷔 100주년 기념 스페셜 에디션 유럽 출시 예고	글로벌오토뉴스
브라부스, 77대 한정판 1,000마력 쿠페	글로벌오토뉴스
중국, 40개 시범도시 지정해 1.7조 위안 애프터마켓 키운다	글로벌오토뉴스
포비아, 아우크스부르크 공장 방산 거점으로 전환… GDELS와 매각 계약 체결	글로벌오토뉴스
J.D.파워 중국 구매 경험 조사, ‘브랜드 대신 경험에 지갑 연다’	글로벌오토뉴스
폭스바겐 카리아드, 베를린에 AI 중심 자동차 소프트웨어 캠퍼스 개소	글로벌오토뉴스
람보르기니, 2025 지속가능성 보고서 발표…하이브리드 전환으로 탄소 40% 감축	글로벌오토뉴스
에프엘오토코리아, 2026 포드 기술경진대회 성료	글로벌오토뉴스
파인인포, 새 마스코트 캐릭터 ‘파니’ 공개	다나와
[창간] 게임 시장 속 AI, “기술이 아닌 프로세스의 문제”	게임동아
5주년 맞이한 카카오게임즈 '오딘', 이번에도 역주행 시작	게임동아
엔씨 리니지 리마스터, ‘무한 나선: 정복자의 첨탑’ 사전예약 진행	게임동아
그라비티, 초대형 신작 ‘라그나로크3’ 대만·홍콩·마카오 지역 TBT 진행 (1)	게임동아
장현국 넥써쓰 대표 "원스토어, 앱마켓 넘어 모바일 게임의 스팀으로 만들겠다"	게임동아
제이미슨 파월 젠스파크 CRO “AI 도입 성공하려면 비효율 줄여야”	IT동아
심즈 대항마 '파라라이브' 판매량 100만 장 돌파하며 흥행 (1)	게임메카
[오늘의 스팀] 델타룬 챕터 5 출시, 동접 역대 최대	게임메카
구글 엔지니어 “GLM-5.2, 美 모델 증류 없이도 미토스급 간다”…중국 오픈소스 ‘자립론’	AI matters
딥엑스, 라즈베리 파이 5용 ‘AI 가속 모듈’ 글로벌 출시…보드 PC로 피지컬 AI 생태계 진입	AI matters
카카오게임즈, 기대작 '도깨비의세계' 공식 티저 페이지 오픈	게임동아
넷마블 '세븐나이츠 리버스', 신규 영웅 ‘오르카’와 각성 2종 추가	게임동아
넷마블 '블레이드&소울 레볼루션', 신화 던전 ‘맹독의 화원’ 업데이트	게임동아
위메이드, ‘레전드 오브 이미르’ 서비스 500일 기념 이벤트 돌입	게임동아
[창간] AI 게임 시대 맞이한 게임업계. 해야할 것과 하지 말아야 할 것 (3)	게임동아
‘페르소나5: 더 팬텀 X’, 하츠네 미쿠 콜라보 ‘기적의 콘서트’ 업데이트	게임동아
[가이드] 나인을 적극 활용하자, '솔: 인챈트' 팁	게임동아
[시승기] 77km 전기주행에 GR 감성까지 '신형 RAV4 솔직 후기'	오토헤럴드
[시승기] BMW iX3 최초 공개! 테슬라 긴장하게 만든 전기 SUV의 미래	오토헤럴드
넥슨, 서든어택 불법 프로그램 사용자 '수사 의뢰'	게임동아
크래프톤 '프로젝트 제타', 글로벌 테스트 시작. ‘미카 미스트’ 첫공개	게임동아
넷마블 '일곱 개의 대죄: 그랜드 크로스', '가치아쿠타 컬래버 업데이트	게임동아
구글플레이 30% 수수료 체계 바뀐다, “결제 방식 따라 차등 적용”	게임동아
10분짜리 게임이 149만 원? 스팀에 등장한 수상한 워킹 시뮬레이터 (1)	게임동아
국가 대항전, SOOP '롤' 크로스 리저널 인비테이셔널 개최	게임메카
생각보다 저렴한데? 최신작들과 큰 차이 없는 ‘GTA6’ 국내 가격 (1)	게임동아
“말로 설명하면 AI가 업무 시스템 만든다”…데이터이쿠, ‘코빌드’ 공개	뉴스탭
웹젠 'R2 오리진', 고대 등급 변신 ‘바알베크’ 업데이트	게임동아
아이 성장에 따라 바꿔 탄다…세발자전거·초경량 유모차 라인업	뉴스탭
나이 들수록 줄어드는 근육량…“꾸준한 단백질 섭취가 관리 핵심”	뉴스탭
리춘시장, 튀긴 동파육에 칵테일까지…중식 안주 라인업 확대	뉴스탭
딥엑스 NPU, 라즈베리 파이 5에 탑재…피지컬 AI 개발자 시장 정조준	뉴스탭
AI에 축구 응원 묻자 치킨부터 떠올렸다…브랜드 추천 판도 달라진다	뉴스탭
솔방울 머리 마스코트 등장…파인인포, 새 캐릭터 ‘파니’ 선보여	뉴스탭
몬헌풍 동물의 숲? 액션 신작 '몬스터 판타지' 공개 (1)	게임메카
르노도 엔지니어 800명 감원..."중국 속도전에 완성차는 칼바람"	오토헤럴드
현대차·제네시스 북미 영업 사령탑 맞교대... 수익성 개선에 초점	오토헤럴드
토요타, 렉서스 전기차 전략 재편 'LF-ZC' 대신 후속 모델 개발	오토헤럴드
자동차 부품사의 새 먹거리 '휴머노이드'… 車보다 로봇이 더 큰 시장	오토헤럴드
이것이 초격차, 더 뉴 BMW iX3 시승기	글로벌오토뉴스
개막전은 T1 대 팀 리퀴드, 2026 MSI 28일 시작	게임메카
독일 아헨공대, “중국산 나트륨이온 배터리 테슬라급 양산 품질 달성”	글로벌오토뉴스
중국 전기차 올인 대신 상용차와 장거리 자동차에 메탄올 다각화 시동	글로벌오토뉴스
CATL-영국 옥토퍼스, 합작법인 스왑토파 설립… 유럽 대형 트럭 배터리 스왑 전선 구축	글로벌오토뉴스
중국 자동차의 세계화, 단순 수출 넘어 포괄적 생태계 구축으로 체질 개선	글로벌오토뉴스
BYD, 다음달 영국 굿우드 페스티벌에서 신차 8종 공개	글로벌오토뉴스
폭스바겐 차이나, 우즈베키스탄 진출… 중국을 글로벌 수출 허브로 전환	글로벌오토뉴스
니오, 영국 위트니에 통합 R&D 센터 통합 개소	글로벌오토뉴스
미국 전력 시장, 태양광이 사상 처음 석탄 발전 추월	글로벌오토뉴스
한자연, 노르웨이공대와 맞손… 친환경 수소·자율주행 글로벌 동맹 구축	글로벌오토뉴스
인도 자동차 부품 중소기업들 AI 혁신으로 전례 없는 재정 효율성 달성 전망	글로벌오토뉴스
토요타 집안싸움 치열… WRC 8라운드 ‘신들의 랠리’ 그리스서 격돌	글로벌오토뉴스
채비, 기후부·서울시 공공 급속충전기 사업 동시 수주	글로벌오토뉴스
페라리코리아, 새 영남권 딜러로 코오롱모빌리티 선정	글로벌오토뉴스
혼다코리아, 미들급 바이크 CBR500R·NX500 E-클러치 출시	글로벌오토뉴스
브리지스톤 타이어, 장마철 국지성 호우 대비 차량 안전 점검 요령 발표	글로벌오토뉴스

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI도 기억을 헷갈린다...대형언어모델의 '지식 충돌' 현상 분석

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI도 기억을 헷갈린다...대형언어모델의 '지식 충돌' 현상 분석

공유하기

공감/비공감