비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

AI도 기억을 헷갈린다...대형언어모델의 '지식 충돌' 현상 분석

2025.01.10. 17:22:55
조회 수
744
20

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Knowledge Conflicts for LLMs: A Survey



칭화대학교와 케임브리지대학교 공동 연구팀이 발표한 최신 연구에 따르면, 대형언어모델(LLM)이 지식을 처리하는 과정에서 세 가지 유형의 '지식 충돌' 현상이 발생하는 것으로 나타났다. 이러한 충돌은 특히 실제 응용 환경에서 노이즈와 잘못된 정보가 흔한 상황에서 모델의 신뢰성과 성능에 큰 영향을 미치는 것으로 밝혀졌다.

진실과 거짓 사이에서 혼란스러운 AI, 지식충돌의 주요 원인

대형언어모델의 지식충돌은 시간적 불일치와 잘못된 정보 오염이라는 두 가지 주요 원인에서 비롯된다. 시간적 불일치는 과거 데이터로 학습된 모델이 현재의 정보와 맞지 않을 때 발생하는데, 이는 모델의 사전학습 패러다임과 모델 확장에 따른 비용 증가로 인해 더욱 심화될 것으로 예상된다. 잘못된 정보로 인한 오염의 경우, 검색된 문서나 사용자 대화에서 의도적으로 조작된 정보가 유입될 때 발생하며, 실험 결과 모델의 성능을 최대 87%까지 저하시키는 것으로 나타났다.


세 갈래로 나뉜 AI의 혼란: 문맥, 정보, 기억의 충돌

대형언어모델의 지식충돌은 크게 문맥-기억 충돌(Context-Memory Conflict), 문맥간 충돌(Inter-Context Conflict), 내부기억 충돌(Intra-Memory Conflict)로 구분된다. 문맥-기억 충돌은 모델의 파라미터에 저장된 지식과 외부에서 주입되는 문맥 정보가 상충할 때 발생한다. 문맥간 충돌은 검색 증강 생성(RAG) 기술 사용 시 검색된 여러 문서들 사이의 정보가 서로 모순될 때 발생하며, 실험 결과 잡음률이 0.8을 초과하면 모든 모델의 성능이 20% 이상 감소했다. 내부기억 충돌은 모델 내부의 지식 표현이 서로 일관되지 않을 때 발생하는 현상이다.

충돌하는 정보 앞에서 AI의 선택은 제각각

실험 결과는 모델들의 행동 패턴이 매우 다양함을 보여줬다. ChatGPT, GPT-4, PaLM2는 모델에 내재된 지식을 선택할 확률이 60% 이상이었으나, 다른 모델들은 주어진 문맥 정보를 80% 이상 선택했다. 특히 대화가 진행되면서 AI의 믿음 체계 변화 비율은 20.7%에서 78.2%까지 증가했다. 더욱 우려되는 점은 GPT-4조차도 FaVIQ 테스트에서 32%의 불일치율을 보였다는 것이다.

"거짓말을 하고 있어요": AI의 자체 모순 감지 능력

모델의 자체 모순 탐지 능력도 평가되었다. GPT-4는 문서 내 모순을 발견할 확률이 70% 이상으로 가장 우수했으나, 다른 모델들은 50% 미만의 성능을 보였다. CONTRADOC 데이터셋을 통한 실험에서는 감정이나 주관적 관점이 포함된 내용, 문서의 길이나 자기모순의 다양성이 모순 탐지 성능에 영향을 미치는 것으로 나타났다.

AI의 혼란을 잡아라: 지식충돌 해결을 위한 세 가지 전략

연구팀은 문제 해결을 위해 '문맥 충실', '잘못된 정보 식별', '정보 원천 분리' 세 가지 주요 전략을 제시했다. 문맥 충실 전략을 적용한 GPT-Neo 20B는 MemoTrap에서 54.4%, NQ-SWAP에서 128%의 성능 향상을 보였다. ChatGPT의 경우 프롬프트 기반 해결책 적용 시 MRC 태스크에서 32.2%, Re-TACRED에서 10.9%의 개선효과가 있었다. 특히 지식충돌 감지 시스템은 80%의 F1 점수를 달성했다.


멀티모달 시대의 새로운 과제: AI 지식충돌의 미래

연구진은 실제 환경의 지식충돌, 다국어 환경에서의 충돌, 멀티모달 데이터 간 충돌을 주요 과제로 지목했다. 특히 이미지(Alayrac et al., 2022), 비디오(Ju et al., 2022), 오디오(Borsos et al., 2023) 등 다양한 형태의 정보가 결합될 때 발생하는 복잡한 충돌 문제 해결이 시급하다고 강조했다. 또한 통합적이고 효율적인 해결책 개발의 필요성도 제기되었다.

해당 리포트의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
스팀에서도 세기말 쿠팡맨 되어보자, ‘데스 스트랜딩 2’ 오는 3월 PC 출시 (1) 게임동아
"우리우리 설날은 연휴래요~" 넥슨, 모바일게임 7종 설 맞이 이벤트 진행 게임동아
[이구동성] 밑 빠진 독에 구멍 두 개 더 (1) 게임메카
“설 선물도 K-전통이 대세”…식품업계, 한복·한과·보자기 입고 소비자 공략 뉴스탭
영화 원작부터 오디오웹소설까지… 설 연휴 ‘정주행’ 책임질 콘텐츠는? 뉴스탭
설 맞아 최대 50% 할인…더네이쳐홀딩스, 브랜드별 파격 혜택 쏜다 뉴스탭
설 연휴 스타필드 하남에 뜬 BYD…씨라이언 7부터 돌핀까지 총출동 뉴스탭
서울시·월드비전, 기후위기 취약아동 통합지원 나선다…‘햇살가득 꿈가득’ 7억 원 투입 뉴스탭
“설 급찐살은 2주 안에 빼라”…삼천리자전거, 체지방 잡는 투 트랙 루틴 공개 뉴스탭
미송자의 노래, 신규 영웅 '에이르' 더한 대규모 업데이트 게임메카
레메디 신작 '컨트롤 레조넌트' 상세 플레이 정보 공개 (1) 게임메카
전기요금 최대 40% 지원…오텍캐리어, 1등급 냉난방기로 소상공인 부담 던다 뉴스탭
스토케, 2026 서울리빙디자인페어 참가…‘레몬 옐로우’ 트립트랩 국내 최초 공개 뉴스탭
대구 수달·83타워 담았다…배럴, 신세계 대구점서 ‘로컬 한정 수모’ 공개 뉴스탭
“누아르에서 오즈까지”…코치, 뉴욕서 2026 가을 컬렉션으로 ‘미국 패션의 미래’ 제시 뉴스탭
“58년 중식 대가가 버거를 만들면?”…맘스터치, 후덕죽 셰프 컬렉션 3월 출격 (1) 뉴스탭
“설 술상도 ‘헬시 플레저’”…당·퓨린 낮춘 맥주부터 오크 숙성 증류주까지 뉴스탭
10승 신화 잇는다…와이드앵글, 2026 시즌 ‘최정예 7인’ 공개 뉴스탭
전기차로 떠나는 프리미엄 쉼…폴스타, 스테이폴리오와 ‘폴스타 스테이’ 론칭 뉴스탭
프랙탈디자인 사면 무선 헤드셋이 공짜? 서린씨앤아이 2월 한정 이벤트 뉴스탭
이 시간 HOT 댓글!
1/4