AI도 기억을 헷갈린다...대형언어모델의 '지식 충돌' 현상 분석 : 다나와 DPG는 내맘을 디피지

Knowledge Conflicts for LLMs: A Survey

칭화대학교와 케임브리지대학교 공동 연구팀이 발표한 최신 연구에 따르면, 대형언어모델(LLM)이 지식을 처리하는 과정에서 세 가지 유형의 '지식 충돌' 현상이 발생하는 것으로 나타났다. 이러한 충돌은 특히 실제 응용 환경에서 노이즈와 잘못된 정보가 흔한 상황에서 모델의 신뢰성과 성능에 큰 영향을 미치는 것으로 밝혀졌다.

진실과 거짓 사이에서 혼란스러운 AI, 지식충돌의 주요 원인

대형언어모델의 지식충돌은 시간적 불일치와 잘못된 정보 오염이라는 두 가지 주요 원인에서 비롯된다. 시간적 불일치는 과거 데이터로 학습된 모델이 현재의 정보와 맞지 않을 때 발생하는데, 이는 모델의 사전학습 패러다임과 모델 확장에 따른 비용 증가로 인해 더욱 심화될 것으로 예상된다. 잘못된 정보로 인한 오염의 경우, 검색된 문서나 사용자 대화에서 의도적으로 조작된 정보가 유입될 때 발생하며, 실험 결과 모델의 성능을 최대 87%까지 저하시키는 것으로 나타났다.

세 갈래로 나뉜 AI의 혼란: 문맥, 정보, 기억의 충돌

대형언어모델의 지식충돌은 크게 문맥-기억 충돌(Context-Memory Conflict), 문맥간 충돌(Inter-Context Conflict), 내부기억 충돌(Intra-Memory Conflict)로 구분된다. 문맥-기억 충돌은 모델의 파라미터에 저장된 지식과 외부에서 주입되는 문맥 정보가 상충할 때 발생한다. 문맥간 충돌은 검색 증강 생성(RAG) 기술 사용 시 검색된 여러 문서들 사이의 정보가 서로 모순될 때 발생하며, 실험 결과 잡음률이 0.8을 초과하면 모든 모델의 성능이 20% 이상 감소했다. 내부기억 충돌은 모델 내부의 지식 표현이 서로 일관되지 않을 때 발생하는 현상이다.

충돌하는 정보 앞에서 AI의 선택은 제각각

실험 결과는 모델들의 행동 패턴이 매우 다양함을 보여줬다. ChatGPT, GPT-4, PaLM2는 모델에 내재된 지식을 선택할 확률이 60% 이상이었으나, 다른 모델들은 주어진 문맥 정보를 80% 이상 선택했다. 특히 대화가 진행되면서 AI의 믿음 체계 변화 비율은 20.7%에서 78.2%까지 증가했다. 더욱 우려되는 점은 GPT-4조차도 FaVIQ 테스트에서 32%의 불일치율을 보였다는 것이다.

"거짓말을 하고 있어요": AI의 자체 모순 감지 능력

모델의 자체 모순 탐지 능력도 평가되었다. GPT-4는 문서 내 모순을 발견할 확률이 70% 이상으로 가장 우수했으나, 다른 모델들은 50% 미만의 성능을 보였다. CONTRADOC 데이터셋을 통한 실험에서는 감정이나 주관적 관점이 포함된 내용, 문서의 길이나 자기모순의 다양성이 모순 탐지 성능에 영향을 미치는 것으로 나타났다.

AI의 혼란을 잡아라: 지식충돌 해결을 위한 세 가지 전략

연구팀은 문제 해결을 위해 '문맥 충실', '잘못된 정보 식별', '정보 원천 분리' 세 가지 주요 전략을 제시했다. 문맥 충실 전략을 적용한 GPT-Neo 20B는 MemoTrap에서 54.4%, NQ-SWAP에서 128%의 성능 향상을 보였다. ChatGPT의 경우 프롬프트 기반 해결책 적용 시 MRC 태스크에서 32.2%, Re-TACRED에서 10.9%의 개선효과가 있었다. 특히 지식충돌 감지 시스템은 80%의 F1 점수를 달성했다.

멀티모달 시대의 새로운 과제: AI 지식충돌의 미래

연구진은 실제 환경의 지식충돌, 다국어 환경에서의 충돌, 멀티모달 데이터 간 충돌을 주요 과제로 지목했다. 특히 이미지(Alayrac et al., 2022), 비디오(Ju et al., 2022), 오디오(Borsos et al., 2023) 등 다양한 형태의 정보가 결합될 때 발생하는 복잡한 충돌 문제 해결이 시급하다고 강조했다. 또한 통합적이고 효율적인 해결책 개발의 필요성도 제기되었다.

해당 리포트의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

두 비즈니스맨의 관계에 균열이 시작되었다 – 트럼프와 머스크 (3)	글로벌오토뉴스
창안자동차, 상하이 모터쇼서 미래 전략 발표…신에너지·지능화·글로벌 확장 '삼각편대' 구축 (2)	글로벌오토뉴스
닛산, 중국 우한 공장 생산 중단…실적 부진 및 경쟁 심화 영향 (1)	글로벌오토뉴스
BYD, 1분기 순이익 두 배 증가…전기차·하이브리드 판매 호조 (1)	글로벌오토뉴스
메르세데스-마이바흐 S-클래스의 품격, 가장 안락한 퍼스트클래스급 승차감을 제공한다 (1)	글로벌오토뉴스
스트라드비젼-악세라, 자율주행 혁신 가속 위한 전략적 협력 체결	글로벌오토뉴스
중국 자율주행 스타트업 모멘타, 상하이 모터쇼서 글로벌 자동차 브랜드와 대규모 협력 계약	글로벌오토뉴스
비스테온-퀄컴, AI 기반 차세대 콕핏 시스템 공동 개발	글로벌오토뉴스
일렉트로비트-메톡, 소프트웨어 기반 차량 혁신 위해 전략적 파트너십 체결	글로벌오토뉴스
비스테온-볼케이노 엔진, AI 기반 스마트 콕핏 솔루션 공개…차량 내 경험 혁신 예고	글로벌오토뉴스
중국 세레스, 상하이 모터쇼서 지능형 안전 생태계 공개…미래 자동차 안전 표준 제시	글로벌오토뉴스
현대차, 'ACT 엑스포 2025'서 북미 수소 물류시장 본격 공략	글로벌오토뉴스
로터스자동차, 지난해 글로벌 차량 인도대수 74% 증가	글로벌오토뉴스
폴스타, 2025년형 폴스타 2 출시...300대 한정 신규 트림 추가, 4390만원부터	글로벌오토뉴스
프랑스, 전기차 등록 혜택 종료 임박…지역별 최대 750유로 부담 우려	글로벌오토뉴스
유럽연합, 'FULL-MAP' 프로젝트 출범…AI 기반 차세대 배터리 개발 박차	글로벌오토뉴스
메르세데스-벤츠 트럭, eActros 600으로 100km 후진 기네스 기록 도전	글로벌오토뉴스
빈패스트, 4분기 전기차 출하량 143% 급증…글로벌 성장 가속	글로벌오토뉴스
BYD, 초대형 운반선 '선전'호 출항…글로벌 전기차 시장 공략 가속	글로벌오토뉴스
BYD, 1분기 순이익 100% 폭증…해외 시장 공략 가속화	글로벌오토뉴스
테슬라, 모델 3 롱레인지 무보증금 리스 출시	글로벌오토뉴스
알핀 A390, 브랜드 첫 전기 스포츠 패스트백 5월 27일 공개	글로벌오토뉴스
지커, 첫 PHEV 플래그십 SUV '9X' 공개…BMW X7·GLS 겨냥	글로벌오토뉴스
뉴욕주, 다시 테슬라와 충돌…직접판매 제한 논쟁 재점화	글로벌오토뉴스
폭스콘, 미국 EV 시장 진출 본격화…‘모델 C’ 제3 브랜드 통해 출시	글로벌오토뉴스
볼보 EX30, 미국 관세 여파로 생산지 전환	글로벌오토뉴스
메르세데스-AMG, 포르쉐 타이칸 겨냥한 전용 전기 패스트백 6월 공개 예정	글로벌오토뉴스
LG전자, 전기차 충전기 사업 철수 발표 (1)	글로벌오토뉴스
삼성SDI, '미국 관세로 EV 배터리 생산비용 상승 불가피' (1)	글로벌오토뉴스
페라리, 880마력 플러그인 하이브리드 296 스페치알레 공개	글로벌오토뉴스
한국타이어, WRC 4라운드 ‘이슬라스 카나리아스 랠리’서 기술력 입증	글로벌오토뉴스
혼다코리아, 모터스포츠 문화 확산 위한 2025 ‘혼다 원 메이커 레이스’ 1라운드 실시	글로벌오토뉴스
한국타이어, ‘스마트플렉스 DH51’ 출시 기념 프로모션 진행	글로벌오토뉴스
현대오토에버, 클라우드인프라센터장 이경수 상무 영입	글로벌오토뉴스
하만카돈, 기아 EV4에 프리미엄 사운드 시스템 적용	글로벌오토뉴스
한국타이어, 티스테이션 ‘올마이티(all my T)’ 신규 브랜드 필름 공개	글로벌오토뉴스
다쏘시스템, ‘2025 글로벌 3DEXPERIENCE 모드심 서밋’ 성료	글로벌오토뉴스
미쉐린코리아, 태백 스피드웨이서 ‘2025 미쉐린 트랙 데이’ 성료	글로벌오토뉴스
JLR 코리아, 고객 신뢰 강화를 위한 미래 혁신 전략 ‘원(ONE)’ 발표	글로벌오토뉴스
볼보트럭코리아, 지역 초등학생 위한 디지털 디톡스 캠페인 실시	글로벌오토뉴스
스카니아코리아, 창립 30주년 기념 카카오톡 이모티콘 출시 (1)	글로벌오토뉴스
GM 한국사업장, 장애인 운영 베이커리 오픈 2주년 맞아 지역사회 기여 재다짐	글로벌오토뉴스
한국토요타자동차, 커넥트투에서 가정의 달 맞이 ‘GR 익스피리언스 데이’ 이벤트 진행	글로벌오토뉴스
제네시스 - 영국 테이트 모던 파트너십 전시 개막	글로벌오토뉴스
BMW 코리아 미래재단, 어린이날 맞아 전국 곳곳에서 다양한 체험형 교육 프로그램 진행	글로벌오토뉴스
한성모터스, ‘메르세데스 트로피 2025 한성모터스 지역 예선’ 성료	글로벌오토뉴스
벤틀리 16대 한정 코치빌트 모델 바투르 컨버터블, 두바이서 세계 최초 실물 공개	글로벌오토뉴스
푸조, 고객 대상 첫 공식 이벤트 ‘308 국도 로드 트립’ 개최	글로벌오토뉴스
혼다코리아, 대전 지역 모터사이클 신규 딜러 MOU 체결	글로벌오토뉴스
한국자동차연구원, '탄소중립 모빌리티 센터' 준공	글로벌오토뉴스
트럼프 대통령, 자동차 부품 관세 부담 완화 조치 발표	글로벌오토뉴스
지엠한마음재단, 농촌 일손 돕기 봉사활동 “강화로 오시겨” 진행	글로벌오토뉴스
기아 서상배 선임 오토컨설턴트, 4천대 판매 ‘그랜드 마스터’ 등극	글로벌오토뉴스
기아, 글로벌 인재 채용 플랫폼 '기아 탤런트 라운지' 개설	글로벌오토뉴스
아우디 코리아, ‘더 뉴 아우디 A5’ 국내 최초 공개 및 사전계약 개시 (2)	글로벌오토뉴스
페라리 12칠린드리, 2025 iF 디자인 어워드 골드 수상…자동차 부문 유일 (3)	글로벌오토뉴스
만트럭버스코리아, 조기 폐차 고객 대상 최대 1천만 원 할인 혜택 제공	글로벌오토뉴스
한성자동차, 2025년 서비스센터 신입직원 대규모 공개채용 실시	글로벌오토뉴스
할리데이비슨 코리아 ‘2025 트라이크 오너스 라이딩 투어’ 성공적 개최	글로벌오토뉴스
BMW, 중국 시장 공략 강화… 현지 AI 기업 딥시크 탑재	글로벌오토뉴스
토요타, '중국 주도' 현지화 전략으로 전환… 전기차 시장 공략 고삐	글로벌오토뉴스
폭스바겐, '중국 맞춤형' 전략 가속… 3년 내 30종 이상 신차 쏟아낸다	글로벌오토뉴스
캐나다, 미국산 보이콧 확산 속, 최대 22% 인상에 수요 '급감' 우려	글로벌오토뉴스
영국, 미국 자동차 관세 인하 검토…자국 수출품 보호 위한 협상 카드	글로벌오토뉴스
미국, 외국 건조 자동차 운반선에 입항료 부과 계획	글로벌오토뉴스
브랜드를 이끄는 리더, 메르세데스-AMG E 53 하이브리드 4MATIC+ 에디션 1 시승기	글로벌오토뉴스
박세리 '맨발 투혼'…세계 여자 골프 역사의 중요 사건 4위	연합뉴스
교포 제임스 한, 잴러토리스 기권으로 PGA 투어 더CJ컵 출전	연합뉴스
세종 16홀 꼼수 파크골프장 유료화 연기…시설개선 후 재추진	연합뉴스
PGA 더CJ컵 우승 후보 0순위 셰플러 "코스가 어려워져서 좋다"	연합뉴스
집밥 먹고 출퇴근하는 PGA 김시우 "아이언 좋아져 자신감 충전"	연합뉴스
첫 롤드컵 우승팀 프나틱 미드 ‘슈세이’ 36세 나이로 별세	게임메카
지나친 스노우볼링 방지한다, 롤 현상금 시스템 개편	게임메카
[오늘의 스팀] 명나라 말 배경 소울라이크 신작 관심	게임메카
발더스 3 개발사 라리안 대표 ‘5년 내 신작 내고 싶다’ (1)	게임메카
이인우, KPGA 챔피언스투어 시즌 개막전 우승	연합뉴스
현대차·기아, 2024 CDP 코리아 어워드 '기후변화 대응ㆍ수자원 관리 부문 '수상	오토헤럴드
슬레이트 CEO, 전기차 시대에 "대형 스크린과 자율주행은 잊어라"	오토헤럴드
커넥트웨이브 '카카오게임즈 배틀그라운드 다나와배 대학최강자전' 공식 후원	다나와
MSI코리아 'MAG B850M 박격포 WIFI' 출시 기념 사용기 이벤트	다나와
‘컴투스 프로야구’ 시리즈, 5월 가정의 달 기념 특별 이벤트 진행	게임동아
게임물관리위원회와 게임과학연구원, 업무협약 체결	게임동아
마이크로닉스 '클래식 II 골드 풀모듈러' 시리즈 구매자 대상 사은 이벤트	다나와
넥슨, ‘마비노기 모바일' 5월 봄맞이 업데이트 예고	게임동아
알파스캔, 27인치 FHD Fast IPS 180Hz 게이밍 모니터 출시 기념 이벤트	다나와
'따라할 수 없는 독특한 스타일' 시트로엥, C5 에어크로스 티저 공개	오토헤럴드
[EV 트랜드] 테슬라, 뉴욕 직판 매장 폐쇄 위기... 프랜차이즈법 갈등 격화	오토헤럴드
르노, 신형 콤팩트 SUV '보레알' 출시 예고... 전 세계 70개국 출시 예정	오토헤럴드
연평균 121대, 기아 서상배 오토컨설턴트 ‘그랜드 마스터’ 등극... 누적 4001대	오토헤럴드
글로벌 인재 채용 플랫폼 '기아 탤런트 라운지' 오픈, 차별화된 콘텐츠 제공	오토헤럴드
감가율 낮추는 핵심 비결... 이 옵션 하나로 최대 2%, 중고찻값 확 달라진다	오토헤럴드
기아 EV4가 더 특별해진 비결... 하만카돈 프리미엄 카오디오 사운드 시스템	오토헤럴드
'축구장 20개 규모' BYD, 세계 최대 자동차 운송선 브라질로 첫 항해	오토헤럴드
페라리 12칠린드리ㆍ12칠린드리 스파이더, iF 디자인 '골드 어워드' 수상	오토헤럴드
만트럭, 노후 경유 트럭 폐차하고 신차 구입 대상 할인 혜택 제공	오토헤럴드
[EV 트렌드] '관세 전쟁 여파' 볼보 EX30, 벨기에 공장서 조기 생산 돌입	오토헤럴드
현대차, ACT 엑스포 2025 참가 '더 뉴 엑시언트 수소전기트럭' 최초 공개	오토헤럴드
기아, 영국서 'PV5' 전격 공개... 유럽 상용차 시장 진출 교두보 구축	오토헤럴드
'296 GTB 스페셜 버전' 800마력 PHEV, 페라리 296 스페치알레 공개	오토헤럴드
시트로엥, 순수 전기 SUV 'C5 에어크로스' 공개... 13인치 대형 스크린 탑재	오토헤럴드

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI도 기억을 헷갈린다...대형언어모델의 '지식 충돌' 현상 분석

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI도 기억을 헷갈린다...대형언어모델의 '지식 충돌' 현상 분석

공유하기

공감/비공감