비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

AI도 기억을 헷갈린다...대형언어모델의 '지식 충돌' 현상 분석

2025.01.10. 17:22:55
조회 수
801
20

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Knowledge Conflicts for LLMs: A Survey



칭화대학교와 케임브리지대학교 공동 연구팀이 발표한 최신 연구에 따르면, 대형언어모델(LLM)이 지식을 처리하는 과정에서 세 가지 유형의 '지식 충돌' 현상이 발생하는 것으로 나타났다. 이러한 충돌은 특히 실제 응용 환경에서 노이즈와 잘못된 정보가 흔한 상황에서 모델의 신뢰성과 성능에 큰 영향을 미치는 것으로 밝혀졌다.

진실과 거짓 사이에서 혼란스러운 AI, 지식충돌의 주요 원인

대형언어모델의 지식충돌은 시간적 불일치와 잘못된 정보 오염이라는 두 가지 주요 원인에서 비롯된다. 시간적 불일치는 과거 데이터로 학습된 모델이 현재의 정보와 맞지 않을 때 발생하는데, 이는 모델의 사전학습 패러다임과 모델 확장에 따른 비용 증가로 인해 더욱 심화될 것으로 예상된다. 잘못된 정보로 인한 오염의 경우, 검색된 문서나 사용자 대화에서 의도적으로 조작된 정보가 유입될 때 발생하며, 실험 결과 모델의 성능을 최대 87%까지 저하시키는 것으로 나타났다.


세 갈래로 나뉜 AI의 혼란: 문맥, 정보, 기억의 충돌

대형언어모델의 지식충돌은 크게 문맥-기억 충돌(Context-Memory Conflict), 문맥간 충돌(Inter-Context Conflict), 내부기억 충돌(Intra-Memory Conflict)로 구분된다. 문맥-기억 충돌은 모델의 파라미터에 저장된 지식과 외부에서 주입되는 문맥 정보가 상충할 때 발생한다. 문맥간 충돌은 검색 증강 생성(RAG) 기술 사용 시 검색된 여러 문서들 사이의 정보가 서로 모순될 때 발생하며, 실험 결과 잡음률이 0.8을 초과하면 모든 모델의 성능이 20% 이상 감소했다. 내부기억 충돌은 모델 내부의 지식 표현이 서로 일관되지 않을 때 발생하는 현상이다.

충돌하는 정보 앞에서 AI의 선택은 제각각

실험 결과는 모델들의 행동 패턴이 매우 다양함을 보여줬다. ChatGPT, GPT-4, PaLM2는 모델에 내재된 지식을 선택할 확률이 60% 이상이었으나, 다른 모델들은 주어진 문맥 정보를 80% 이상 선택했다. 특히 대화가 진행되면서 AI의 믿음 체계 변화 비율은 20.7%에서 78.2%까지 증가했다. 더욱 우려되는 점은 GPT-4조차도 FaVIQ 테스트에서 32%의 불일치율을 보였다는 것이다.

"거짓말을 하고 있어요": AI의 자체 모순 감지 능력

모델의 자체 모순 탐지 능력도 평가되었다. GPT-4는 문서 내 모순을 발견할 확률이 70% 이상으로 가장 우수했으나, 다른 모델들은 50% 미만의 성능을 보였다. CONTRADOC 데이터셋을 통한 실험에서는 감정이나 주관적 관점이 포함된 내용, 문서의 길이나 자기모순의 다양성이 모순 탐지 성능에 영향을 미치는 것으로 나타났다.

AI의 혼란을 잡아라: 지식충돌 해결을 위한 세 가지 전략

연구팀은 문제 해결을 위해 '문맥 충실', '잘못된 정보 식별', '정보 원천 분리' 세 가지 주요 전략을 제시했다. 문맥 충실 전략을 적용한 GPT-Neo 20B는 MemoTrap에서 54.4%, NQ-SWAP에서 128%의 성능 향상을 보였다. ChatGPT의 경우 프롬프트 기반 해결책 적용 시 MRC 태스크에서 32.2%, Re-TACRED에서 10.9%의 개선효과가 있었다. 특히 지식충돌 감지 시스템은 80%의 F1 점수를 달성했다.


멀티모달 시대의 새로운 과제: AI 지식충돌의 미래

연구진은 실제 환경의 지식충돌, 다국어 환경에서의 충돌, 멀티모달 데이터 간 충돌을 주요 과제로 지목했다. 특히 이미지(Alayrac et al., 2022), 비디오(Ju et al., 2022), 오디오(Borsos et al., 2023) 등 다양한 형태의 정보가 결합될 때 발생하는 복잡한 충돌 문제 해결이 시급하다고 강조했다. 또한 통합적이고 효율적인 해결책 개발의 필요성도 제기되었다.

해당 리포트의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
구글플레이, BIC Festival 2026 공식 지원.. '구글 어워즈 신설' 게임동아
신임 대표 선임 앞둔 카카오게임즈, 반등을 위한 무기는? 게임동아
레니우게임즈 '그레이 사가'와 '나혼자만 레벨업' 특별 컬래버레이션 예고 게임동아
[한주의게임소식] 매출 1위 폭풍 일으킨 ‘솔’과 일본서 ‘쪼아요’ 돌풍 중인 ‘트릭컬’ 게임동아
EFM네트웍스, 리얼텍 기반 공유기 Full Mesh 업그레이드 펌웨어 배포 다나와
CATL, 1분기 순이익 207억 위안 중국 7대 완성차 합산 이익보다 많아 글로벌오토뉴스
곰팡이 제거 핵심 비법, 딱 2시간만 유지하세요 동영상 있음 다나와
카제나, 중국서 통했다… 中 애플 앱스토어 매출 8위 기록 게임동아
게임하는 어르신들… 보드게임 대회 '보드래요' 성료 (1) 게임동아
스페이스X-커서 인수가 드러낸 ‘공개시장의 힘’… 상장 통화로 AI 추격 (1) AI matters
오픈AI, 챗GPT 엔터프라이즈에 ‘사용량 분석·지출 통제’ 강화… 기업 AI 비용 가시성 확대 AI matters
나도 모르는 AI 에이전트 보안 유출 사고 막는다… 뉴럴트러스트, EU 역대 최대 투자 유치 AI matters
한국·대만, 美 대중 규제의 반사이익… AI 하드웨어 호황에 증시 약진 (1) AI matters
바이트댄스, MS 최대 AI 고객 됐다… 오픈AI 모델로 연 1.5조 원 Azure 지출 AI matters
'소형차 경계 붕괴' 현대차, SUV로 벌크업 시도한 신형 i20 공개 (1) 오토헤럴드
현대차그룹, 세종기지 '디젤 의존' 끝낸다...남극형 그린수소 그리드 구축 오토헤럴드
60년 전 슈퍼 스포츠카의 시작, 람보르기니 미우라 게임 속 전설로 부활 오토헤럴드
'레인지로버, 디펜더도 전기차' 전동화 전략 수정, 하이브리드 병행 선언 오토헤럴드
현대차그룹, 남극과학기지에 그린수소 그리드 구축 글로벌오토뉴스
원형 잃어버린 스티어링 휠, 기술 과시가 낳은 인체공학적 오류 글로벌오토뉴스
이 시간 HOT 댓글!
1/4