AI도 기억을 헷갈린다...대형언어모델의 '지식 충돌' 현상 분석 : 다나와 DPG는 내맘을 디피지

Knowledge Conflicts for LLMs: A Survey

칭화대학교와 케임브리지대학교 공동 연구팀이 발표한 최신 연구에 따르면, 대형언어모델(LLM)이 지식을 처리하는 과정에서 세 가지 유형의 '지식 충돌' 현상이 발생하는 것으로 나타났다. 이러한 충돌은 특히 실제 응용 환경에서 노이즈와 잘못된 정보가 흔한 상황에서 모델의 신뢰성과 성능에 큰 영향을 미치는 것으로 밝혀졌다.

진실과 거짓 사이에서 혼란스러운 AI, 지식충돌의 주요 원인

대형언어모델의 지식충돌은 시간적 불일치와 잘못된 정보 오염이라는 두 가지 주요 원인에서 비롯된다. 시간적 불일치는 과거 데이터로 학습된 모델이 현재의 정보와 맞지 않을 때 발생하는데, 이는 모델의 사전학습 패러다임과 모델 확장에 따른 비용 증가로 인해 더욱 심화될 것으로 예상된다. 잘못된 정보로 인한 오염의 경우, 검색된 문서나 사용자 대화에서 의도적으로 조작된 정보가 유입될 때 발생하며, 실험 결과 모델의 성능을 최대 87%까지 저하시키는 것으로 나타났다.

세 갈래로 나뉜 AI의 혼란: 문맥, 정보, 기억의 충돌

대형언어모델의 지식충돌은 크게 문맥-기억 충돌(Context-Memory Conflict), 문맥간 충돌(Inter-Context Conflict), 내부기억 충돌(Intra-Memory Conflict)로 구분된다. 문맥-기억 충돌은 모델의 파라미터에 저장된 지식과 외부에서 주입되는 문맥 정보가 상충할 때 발생한다. 문맥간 충돌은 검색 증강 생성(RAG) 기술 사용 시 검색된 여러 문서들 사이의 정보가 서로 모순될 때 발생하며, 실험 결과 잡음률이 0.8을 초과하면 모든 모델의 성능이 20% 이상 감소했다. 내부기억 충돌은 모델 내부의 지식 표현이 서로 일관되지 않을 때 발생하는 현상이다.

충돌하는 정보 앞에서 AI의 선택은 제각각

실험 결과는 모델들의 행동 패턴이 매우 다양함을 보여줬다. ChatGPT, GPT-4, PaLM2는 모델에 내재된 지식을 선택할 확률이 60% 이상이었으나, 다른 모델들은 주어진 문맥 정보를 80% 이상 선택했다. 특히 대화가 진행되면서 AI의 믿음 체계 변화 비율은 20.7%에서 78.2%까지 증가했다. 더욱 우려되는 점은 GPT-4조차도 FaVIQ 테스트에서 32%의 불일치율을 보였다는 것이다.

"거짓말을 하고 있어요": AI의 자체 모순 감지 능력

모델의 자체 모순 탐지 능력도 평가되었다. GPT-4는 문서 내 모순을 발견할 확률이 70% 이상으로 가장 우수했으나, 다른 모델들은 50% 미만의 성능을 보였다. CONTRADOC 데이터셋을 통한 실험에서는 감정이나 주관적 관점이 포함된 내용, 문서의 길이나 자기모순의 다양성이 모순 탐지 성능에 영향을 미치는 것으로 나타났다.

AI의 혼란을 잡아라: 지식충돌 해결을 위한 세 가지 전략

연구팀은 문제 해결을 위해 '문맥 충실', '잘못된 정보 식별', '정보 원천 분리' 세 가지 주요 전략을 제시했다. 문맥 충실 전략을 적용한 GPT-Neo 20B는 MemoTrap에서 54.4%, NQ-SWAP에서 128%의 성능 향상을 보였다. ChatGPT의 경우 프롬프트 기반 해결책 적용 시 MRC 태스크에서 32.2%, Re-TACRED에서 10.9%의 개선효과가 있었다. 특히 지식충돌 감지 시스템은 80%의 F1 점수를 달성했다.

멀티모달 시대의 새로운 과제: AI 지식충돌의 미래

연구진은 실제 환경의 지식충돌, 다국어 환경에서의 충돌, 멀티모달 데이터 간 충돌을 주요 과제로 지목했다. 특히 이미지(Alayrac et al., 2022), 비디오(Ju et al., 2022), 오디오(Borsos et al., 2023) 등 다양한 형태의 정보가 결합될 때 발생하는 복잡한 충돌 문제 해결이 시급하다고 강조했다. 또한 통합적이고 효율적인 해결책 개발의 필요성도 제기되었다.

해당 리포트의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

구글플레이, BIC Festival 2026 공식 지원.. '구글 어워즈 신설'	게임동아
신임 대표 선임 앞둔 카카오게임즈, 반등을 위한 무기는?	게임동아
레니우게임즈 '그레이 사가'와 '나혼자만 레벨업' 특별 컬래버레이션 예고	게임동아
[한주의게임소식] 매출 1위 폭풍 일으킨 ‘솔’과 일본서 ‘쪼아요’ 돌풍 중인 ‘트릭컬’	게임동아
EFM네트웍스, 리얼텍 기반 공유기 Full Mesh 업그레이드 펌웨어 배포	다나와
CATL, 1분기 순이익 207억 위안 중국 7대 완성차 합산 이익보다 많아	글로벌오토뉴스
곰팡이 제거 핵심 비법, 딱 2시간만 유지하세요 동영상 있음	다나와
카제나, 중국서 통했다… 中 애플 앱스토어 매출 8위 기록	게임동아
게임하는 어르신들… 보드게임 대회 '보드래요' 성료 (1)	게임동아
스페이스X-커서 인수가 드러낸 ‘공개시장의 힘’… 상장 통화로 AI 추격 (1)	AI matters
오픈AI, 챗GPT 엔터프라이즈에 ‘사용량 분석·지출 통제’ 강화… 기업 AI 비용 가시성 확대	AI matters
나도 모르는 AI 에이전트 보안 유출 사고 막는다… 뉴럴트러스트, EU 역대 최대 투자 유치	AI matters
한국·대만, 美 대중 규제의 반사이익… AI 하드웨어 호황에 증시 약진 (1)	AI matters
바이트댄스, MS 최대 AI 고객 됐다… 오픈AI 모델로 연 1.5조 원 Azure 지출	AI matters
'소형차 경계 붕괴' 현대차, SUV로 벌크업 시도한 신형 i20 공개 (1)	오토헤럴드
현대차그룹, 세종기지 '디젤 의존' 끝낸다...남극형 그린수소 그리드 구축	오토헤럴드
60년 전 슈퍼 스포츠카의 시작, 람보르기니 미우라 게임 속 전설로 부활	오토헤럴드
'레인지로버, 디펜더도 전기차' 전동화 전략 수정, 하이브리드 병행 선언	오토헤럴드
현대차그룹, 남극과학기지에 그린수소 그리드 구축	글로벌오토뉴스
원형 잃어버린 스티어링 휠, 기술 과시가 낳은 인체공학적 오류	글로벌오토뉴스
유럽인 대다수, 청정 에너지 전환과 전동화 투입 확대 지지	글로벌오토뉴스
JLR, 차세대 전기차 플랫폼 EMA에 하이브리드 전격 추가… 전략 수정 속도	글로벌오토뉴스
유럽 승용 전기차 시장 점유율 21%	글로벌오토뉴스
현대차, 미 전기차 시장 2위 탈환하나	글로벌오토뉴스
개소세 인하 종료 앞둔 르노코리아, 6월 파격 구매 혜택 및 시승 프로모션 실시	글로벌오토뉴스
어플라이드 인튜이션, 자율주행 시스템 일본 시장 확대	글로벌오토뉴스
보쉬, 일본에서 중국 양산형 E2E 자율주행 시범 운행 개시	글로벌오토뉴스
베트남 빈패스트, 5월 내수시장 전기차 판매 70% 증가	글로벌오토뉴스
람보르기니 미우라 출시 60주년, 디지털 세상서 이어지는 전설의 유산	글로벌오토뉴스
도시의 뒷골목을 누비는 강렬한 근접 액션. ‘백스트리트’ (2)	게임동아
블리자드 '월드 오브 워크래프트: 한밤', 신규 업데이트 ‘계시’ 적용	게임동아
카카오게임즈, 카카오톡 더보기 탭에 설치없이 즐기는 캐주얼 게임 25종 출시	게임동아
'승리의 여신: 니케', 밴드 라이브 콘서트 'Full Burst Live' 7월 18일 개최	게임동아
"AI 대전환 시대" 'NDC 2026' 무엇을 남겼나?	게임동아
한정판 굿즈도, 한국 첫 워해머 스토어 강남에 열린다	게임메카
넷마블 '솔: 인챈트', 매출 순위 애플 1위와 구글 1위 등극	게임동아
컴투스, 그동안 쌓였던 RPG의 악몽, '제우스'의 번개로 뚫어내나	게임동아
‘검은 신화: 오공’ 판매량 3천만 장 돌파... “판매량 절반 이상이 해외”	게임동아
“이름은 ‘오덕’으로 하시죠!” 의외로 한국 영향 받은 해외 게임들	게임동아
로그라이트 콘텐츠까지 등장! '그랑블루 판타지 리링크 – 엔드리스 라그나로크' 체험기	게임동아
마블 울버린, 갓오브워 라우페이… 다시 스토리 즐기는 액션 게임이 대세로?	게임동아
[NDC 2026] "이용자가 개발자가 된다" 로블록스가 바꾼 게임 생태계	게임동아
콘텐츠 1.5배·플레이 시간 2배! 사이게임즈, '그랑블루 판타지 리링크 – 엔드리스 라그나로크' 소개	게임동아
앱인토스 흥행작 '용사단 키우기', 버스에잇에서 만난다	게임동아
넷마블, 신작 '솔: 인챈트' 빠르게 신규 월드 추가 나서	게임동아
[NDC 2026] 넥슨과 G식백과가 말한 미래 "크리에이터는 광고가 아닌 동반자"	게임동아
[오늘의 스팀] 공식 한국어 지원, 무협 ‘태오회권’ 정식 출시	게임메카
멧챠 카멜레온, 방 찾기와 검색 쉽게 할 수 있게 됐다	게임메카
사이게임즈, '그랑블루 판타지 리링크 – 엔드리스 라그나로크' 체험판 배포	게임동아
[NDC 2026] 넥슨과 크래프톤이 밀하는 AI 전환의 핵심 "결국은 창의성"	게임동아
전동화 속도 '中 가속·日 후진' ICCT, 현대차·기아 '추격 그룹' 진입	오토헤럴드
출시 2년 만에, 검은 신화: 오공 판매량 3,000만 장 넘었다 (1)	게임메카
큐닉스, 게이밍 디스플레이 브랜드로 재정비... 세계 최초 32인치 FHD 280Hz 게이밍 모니터 공개	게임동아
아이돌 테네브리아 등장! 스마일게이트 '카제나', 시즌3 마지막 스토리 업데이트	게임동아
이환, GS25 컬래버 시작…도시락 먹고 한정 굿즈 받자	게임동아
스텔란티스·우버·웨이브 3자 동맹 '자율주행 서비스 공동 개발'	오토헤럴드
현대차, 월드컵으로 ‘스포츠워싱’ 논란... 멕시코전 앞두고 시위 비상	오토헤럴드
전기차 화재 막는다…국토부, 버스·이륜차까지 무상 점검 확대	오토헤럴드
417. 현대차그룹, 테슬라와 엔비디아, 중국을 넘는 새로운 패러다임 필요	글로벌오토뉴스
모빌아이, 2027년 미국서 자체 로보택시 사업 개시… 웨이모·테슬라와 정면 승부	글로벌오토뉴스
BYD, 브라질에 5억 레알 배터리 투자 감행	글로벌오토뉴스
우버, 루시드·누로와 동맹… 2027년 휴스턴서 프리미엄 로보택시 서비스 출범	글로벌오토뉴스
포르쉐, 2027년형 타이칸 공개… 가상 기어 ‘E-시프트’ 및 주행거리 700km 확보	글로벌오토뉴스
폭스바겐 그룹, 2030년까지 5만 명 감원 계획 (1)	글로벌오토뉴스
현대차그룹 제네시스, 오스트리아·덴마크 등 유럽 4개국 추가 진출	글로벌오토뉴스
유가 폭등에 SUV 유지비 급증… 폭스바겐, 북미 시장 소형차·세단 회귀 가능성 제기	글로벌오토뉴스
BMW, 역대 최대 141kWh 배터리 탑재한 iX5 최초 공개	글로벌오토뉴스
콘티넨탈, 르노와 손잡고 초 저 구름저항 전기차 타이어 개발… 주행거리 30km 연장	글로벌오토뉴스
테슬라 FSD 유럽 승인 확대 속 착시 데이터 논란 고조	글로벌오토뉴스
토요타코리아, ‘올 뉴 RAV4’ 출시 기념 전국 특별 서비스 캠페인 개시	글로벌오토뉴스
렉서스코리아, 전국 공식 서비스센터서 ‘2026 썸머 리프레시 서비스 캠페인’ 개시	글로벌오토뉴스
토요타자동차, 신형 렉서스 ES에 친환경·고도화 안전 신기술 대거 탑재	글로벌오토뉴스
채비, KT와 맞손… AIoT 기반 영상 관제 및 결제 통합 시스템 구축	글로벌오토뉴스
일본 정부, 전기차 폐배터리 수거 법적 의무화 추진	글로벌오토뉴스
제네시스 초대형 전기 SUV GV90 연말 공개 이어 내년 상반기 출시	글로벌오토뉴스
온세미, PCIM 유럽서 차세대 모빌리티 반도체 공개	글로벌오토뉴스
한국타이어, ‘2026 런던-브라이튼 EV 랠리’ 공식 후원… 전기차 브랜드 ‘아이온’ 전시	글로벌오토뉴스
BMW, 중국 침체와 중동 분쟁에 2026년 영업이익률 1~3% 축소	글로벌오토뉴스
지리 그룹 모터스포츠, TCR 월드 투어 스페인 대회서 주말 3연승 대기록 달성	글로벌오토뉴스
메르세데스-벤츠 사회공헌위, 동두천시 아동보호전문기관 건립에 5억 원 기부	글로벌오토뉴스
BMW 코리아, 차세대 순수전기 SAV ‘더 뉴 BMW iX3’ 국내 공식 출시	글로벌오토뉴스
중국 자동차 제조사, 우핸들 고급 EV 시장 급진출… 일본 텃밭 흔든다	글로벌오토뉴스
BMW 미니, 인도 시장서 고속 성장 전망 (1)	글로벌오토뉴스
고품질 오픈월드와 상호작용, ‘애니모’ 플레이 영상 공개	게임메카
신의 권한을 행사할 시간, 솔: 인챈트 정식 서비스 시작	게임메카
‘게임스컴’에 독일 대통령 온다... “독일 국가 원수 첫 참석”	게임동아
카카오게임즈, ‘오딘Q: 발키리스콜’ 티저 사이트 오픈	게임동아
스튜디오 폐쇄도 이상하지 않다, ‘마라톤’ 부진에 흔들리는 번지... 대규모 감원설까지	게임동아
탈세 논란 ‘룰러’ 박재혁, 사회봉사 40시간·징계부가금 2천만 원 징계	게임동아
[NDC 2026] 넥슨이 20년 전 게임을 다시 되살리는 법	게임동아
배틀그라운드 블루존 시스템 변화 등을 담은 42.1 업데이트 공개	게임동아
넷마블, 신(神) 되어 즐기는 MMORPG ‘솔: 인챈트’ 오늘 출격	게임동아
[NDC 2026] "데이터 민주화" 시도하는 넥슨의 AI 프로젝트 '모노레이크'	게임동아
[NDC 2026] 넥슨이 분석한 "스팀 데이터로 잠재 유저를 찾는 법"	게임동아
4000여개의 신작들을 만난다. 스팀 넥스트 페스트에서 만나는 한국 게임은?	게임동아
[NDC 2026] 림월드 개발자 "인간은 사랑스러운 동시에 무서운 존재"	게임동아
넷마블 '몬길: STAR DIVE', 신규 5성 백린의 무녀 '나기' 등장	게임동아
[순위분석] 맞춤 클래스 출전, 월드컵 꽉 잡은 FC 온라인	게임메카
[오늘의 스팀] 10주년 맞이한 데바데, 역대 최고 동접	게임메카
“리부트로 돌아오겠다” 카운터사이드 서비스 종료 발표	게임메카

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI도 기억을 헷갈린다...대형언어모델의 '지식 충돌' 현상 분석

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI도 기억을 헷갈린다...대형언어모델의 '지식 충돌' 현상 분석

공유하기

공감/비공감