비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

AI도 기억을 헷갈린다...대형언어모델의 '지식 충돌' 현상 분석

2025.01.10. 17:22:55
조회 수
569
20

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

Knowledge Conflicts for LLMs: A Survey



칭화대학교와 케임브리지대학교 공동 연구팀이 발표한 최신 연구에 따르면, 대형언어모델(LLM)이 지식을 처리하는 과정에서 세 가지 유형의 '지식 충돌' 현상이 발생하는 것으로 나타났다. 이러한 충돌은 특히 실제 응용 환경에서 노이즈와 잘못된 정보가 흔한 상황에서 모델의 신뢰성과 성능에 큰 영향을 미치는 것으로 밝혀졌다.

진실과 거짓 사이에서 혼란스러운 AI, 지식충돌의 주요 원인

대형언어모델의 지식충돌은 시간적 불일치와 잘못된 정보 오염이라는 두 가지 주요 원인에서 비롯된다. 시간적 불일치는 과거 데이터로 학습된 모델이 현재의 정보와 맞지 않을 때 발생하는데, 이는 모델의 사전학습 패러다임과 모델 확장에 따른 비용 증가로 인해 더욱 심화될 것으로 예상된다. 잘못된 정보로 인한 오염의 경우, 검색된 문서나 사용자 대화에서 의도적으로 조작된 정보가 유입될 때 발생하며, 실험 결과 모델의 성능을 최대 87%까지 저하시키는 것으로 나타났다.


세 갈래로 나뉜 AI의 혼란: 문맥, 정보, 기억의 충돌

대형언어모델의 지식충돌은 크게 문맥-기억 충돌(Context-Memory Conflict), 문맥간 충돌(Inter-Context Conflict), 내부기억 충돌(Intra-Memory Conflict)로 구분된다. 문맥-기억 충돌은 모델의 파라미터에 저장된 지식과 외부에서 주입되는 문맥 정보가 상충할 때 발생한다. 문맥간 충돌은 검색 증강 생성(RAG) 기술 사용 시 검색된 여러 문서들 사이의 정보가 서로 모순될 때 발생하며, 실험 결과 잡음률이 0.8을 초과하면 모든 모델의 성능이 20% 이상 감소했다. 내부기억 충돌은 모델 내부의 지식 표현이 서로 일관되지 않을 때 발생하는 현상이다.

충돌하는 정보 앞에서 AI의 선택은 제각각

실험 결과는 모델들의 행동 패턴이 매우 다양함을 보여줬다. ChatGPT, GPT-4, PaLM2는 모델에 내재된 지식을 선택할 확률이 60% 이상이었으나, 다른 모델들은 주어진 문맥 정보를 80% 이상 선택했다. 특히 대화가 진행되면서 AI의 믿음 체계 변화 비율은 20.7%에서 78.2%까지 증가했다. 더욱 우려되는 점은 GPT-4조차도 FaVIQ 테스트에서 32%의 불일치율을 보였다는 것이다.

"거짓말을 하고 있어요": AI의 자체 모순 감지 능력

모델의 자체 모순 탐지 능력도 평가되었다. GPT-4는 문서 내 모순을 발견할 확률이 70% 이상으로 가장 우수했으나, 다른 모델들은 50% 미만의 성능을 보였다. CONTRADOC 데이터셋을 통한 실험에서는 감정이나 주관적 관점이 포함된 내용, 문서의 길이나 자기모순의 다양성이 모순 탐지 성능에 영향을 미치는 것으로 나타났다.

AI의 혼란을 잡아라: 지식충돌 해결을 위한 세 가지 전략

연구팀은 문제 해결을 위해 '문맥 충실', '잘못된 정보 식별', '정보 원천 분리' 세 가지 주요 전략을 제시했다. 문맥 충실 전략을 적용한 GPT-Neo 20B는 MemoTrap에서 54.4%, NQ-SWAP에서 128%의 성능 향상을 보였다. ChatGPT의 경우 프롬프트 기반 해결책 적용 시 MRC 태스크에서 32.2%, Re-TACRED에서 10.9%의 개선효과가 있었다. 특히 지식충돌 감지 시스템은 80%의 F1 점수를 달성했다.


멀티모달 시대의 새로운 과제: AI 지식충돌의 미래

연구진은 실제 환경의 지식충돌, 다국어 환경에서의 충돌, 멀티모달 데이터 간 충돌을 주요 과제로 지목했다. 특히 이미지(Alayrac et al., 2022), 비디오(Ju et al., 2022), 오디오(Borsos et al., 2023) 등 다양한 형태의 정보가 결합될 때 발생하는 복잡한 충돌 문제 해결이 시급하다고 강조했다. 또한 통합적이고 효율적인 해결책 개발의 필요성도 제기되었다.

해당 리포트의 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
두 비즈니스맨의 관계에 균열이 시작되었다 – 트럼프와 머스크 (3) 글로벌오토뉴스
창안자동차, 상하이 모터쇼서 미래 전략 발표…신에너지·지능화·글로벌 확장 '삼각편대' 구축 (2) 글로벌오토뉴스
닛산, 중국 우한 공장 생산 중단…실적 부진 및 경쟁 심화 영향 (1) 글로벌오토뉴스
BYD, 1분기 순이익 두 배 증가…전기차·하이브리드 판매 호조 (1) 글로벌오토뉴스
메르세데스-마이바흐 S-클래스의 품격, 가장 안락한 퍼스트클래스급 승차감을 제공한다 (1) 글로벌오토뉴스
스트라드비젼-악세라, 자율주행 혁신 가속 위한 전략적 협력 체결 글로벌오토뉴스
중국 자율주행 스타트업 모멘타, 상하이 모터쇼서 글로벌 자동차 브랜드와 대규모 협력 계약 글로벌오토뉴스
비스테온-퀄컴, AI 기반 차세대 콕핏 시스템 공동 개발 글로벌오토뉴스
일렉트로비트-메톡, 소프트웨어 기반 차량 혁신 위해 전략적 파트너십 체결 글로벌오토뉴스
비스테온-볼케이노 엔진, AI 기반 스마트 콕핏 솔루션 공개…차량 내 경험 혁신 예고 글로벌오토뉴스
중국 세레스, 상하이 모터쇼서 지능형 안전 생태계 공개…미래 자동차 안전 표준 제시 글로벌오토뉴스
현대차, 'ACT 엑스포 2025'서 북미 수소 물류시장 본격 공략 글로벌오토뉴스
로터스자동차, 지난해 글로벌 차량 인도대수 74% 증가 글로벌오토뉴스
폴스타, 2025년형 폴스타 2 출시...300대 한정 신규 트림 추가, 4390만원부터 글로벌오토뉴스
프랑스, 전기차 등록 혜택 종료 임박…지역별 최대 750유로 부담 우려 글로벌오토뉴스
유럽연합, 'FULL-MAP' 프로젝트 출범…AI 기반 차세대 배터리 개발 박차 글로벌오토뉴스
메르세데스-벤츠 트럭, eActros 600으로 100km 후진 기네스 기록 도전 글로벌오토뉴스
빈패스트, 4분기 전기차 출하량 143% 급증…글로벌 성장 가속 글로벌오토뉴스
BYD, 초대형 운반선 '선전'호 출항…글로벌 전기차 시장 공략 가속 글로벌오토뉴스
BYD, 1분기 순이익 100% 폭증…해외 시장 공략 가속화 글로벌오토뉴스
이 시간 HOT 댓글!
1/4