"챗GPT가 고의로 실수 숨기면 신뢰도 3배 상승한다"... IBM이 밝힌 충격적 진실 : 다나와 DPG는 내맘을 디피지

AI 챗봇이 그럴듯하게 들리지만 틀린 정보를 말하는 문제가 심각해지고 있다. 실제로 구글의 AI가 공개 시연에서 틀린 정보를 말해 회사 주가가 1000억 달러나 떨어진 사건이 있었고, 에어캐나다는 AI 챗봇이 제공한 거짓 정보 때문에 소송까지 당했다.

미국의 정보기술 기업인 IBM의 연구진이 22개국 출신 148명을 대상으로 총 592개 과제를 수행한 대규모 실험 결과, AI가 틀린 정보를 빨간색으로 표시해서 "이건 틀릴 수 있어요"라고 알려주는 것보다, 아예 그 부분을 지워버리거나 애매하게 바꿔서 말하는 것이 사용자들이 AI를 더 믿게 만든다는 사실을 발견했다. 참가자들은 소프트웨어 개발자 50명, 엔지니어 26명, 영업직 21명, 디자이너 15명 등 다양한 직업군으로 구성됐다. 이는 기존에 "투명하게 모든 정보를 공개해야 한다"는 AI 설계 원칙과는 정반대의 결과다.

평균 153단어 답변 중 43%가 틀린 정보인 상황에서 5가지 실험

연구진은 AI가 답변할 때 틀릴 수 있는 내용을 어떻게 처리하는지에 따라 5가지 방법을 비교했다. 실험에는 평균 153.5단어, 7.5문장으로 구성된 AI 답변이 사용됐고, 각 답변에는 평균 34개의 사실이 포함됐는데 이 중 14.75개(43%)가 틀린 정보였다.

첫 번째는 아무 표시 없이 그냥 답변하는 기본 방식이다. 두 번째는 틀릴 가능성이 높은 부분을 주황색으로 칠해서 "이 부분은 의심스러워요"라고 알려주는 투명 방식이다. 주황색을 선택한 이유는 사전 인터뷰에서 참가자들이 "주황색은 일반적으로 뭔가 잘못되었다는 것을 나타낸다"고 답했기 때문이다. 세 번째는 반대로 확실한 부분만 파란색으로 칠해서 강조하는 주목 방식이다. 네 번째는 틀릴 수 있는 부분을 아예 지우고 '[..]' 표시만 남기는 삭제 방식이고, 다섯 번째는 틀린 내용을 애매한 표현으로 바꾸는 모호 방식이다.

실험은 기자가 인물 전기를 쓰는 상황으로 설정됐고, 참가자들에게 위키피디아를 참고 자료로 제공했다. 실험 결과 삭제 방식과 모호 방식을 쓴 그룹에서 사용자들이 AI를 가장 많이 신뢰했다.

IBM 그래나이트 모델이 최고 성능... 6가지 패턴으로 모호화 구현

이번 연구에서 가장 주목받는 것은 '모호 방식'이라는 새로운 기법이다. 예를 들어 AI가 "그는 1950년에 파리로 이주했다"라고 틀린 정보를 말하려고 하면, 이를 "그는 1950년대에 다른 나라로 이주했다"로 바꿔서 말하는 것이다. 틀린 정보를 완전히 지우는 대신 틀리지 않을 정도로만 애매하게 만드는 방식이다.

연구진은 이를 위해 7개 언어모델과 5가지 프롬프트를 비교 실험했고, IBM의 그래나이트(Granite) 모델이 최고 성능을 보였다. 구현 과정은 3단계로 이뤄진다. 먼저 AI가 말하려는 내용을 작은 사실 단위로 쪼개고, 각각이 맞는지 틀리는지 판단한 다음, 틀린 부분만 애매한 표현으로 바꿔서 다시 하나의 문장으로 합치는 과정이다.

모호화 작업에는 6가지 패턴이 사용됐다. 범위 확대(뉴욕 → 미국), 불명확화(일부 사람들, 전문가들, 많은 사람들), 완곡어법(은퇴 → 물러나다), 근사치(2004년 → 2004년경, 2000년대), 수동 구문(믿어진다, 여겨진다), 부사 사용(종종, 아마도) 등이다. 기술의 불완전함 때문에 연구진이 최종 결과물을 손수 편집하는 과정도 거쳤다.

"AI가 왜 자기 실수를 강조하나"... 참가자 사전 인터뷰에서 나온 솔직한 반응

지금까지 AI 업계에서는 "사용자가 AI를 제대로 이해하려면 모든 정보를 투명하게 공개해야 한다"는 원칙이 지배적이었다. 틀릴 수 있는 정보라도 표시를 해서 사용자에게 알려주는 것이 좋다고 여겨졌다. 하지만 이번 연구는 이런 생각이 틀렸을 수 있음을 보여준다.

연구진이 6명을 대상으로 한 사전 인터뷰에서 참가자들은 "AI가 왜 자기 실수를 굳이 강조해서 보여주는지 모르겠다"며 "차라리 안 보여주는 게 낫겠다"고 답했다. 사람끼리 대화할 때도 거짓말이라고 생각하는 내용은 아예 말하지 않는 것이 신뢰 관계에 도움이 된다는 기본 원리를 AI에도 적용한 것이다.

특히 맞는 부분만 파란색으로 강조하는 주목 방식은 오히려 사용자들의 기대치를 너무 높여서 부작용을 낳는 것으로 나타났다. 과도한 강조가 사용자 인식을 조작하려는 시도로 받아들여져 부정적인 반응을 불러일으켰다. 흥미롭게도 참가자들이 위키피디아 참고 자료를 클릭하는 비율에는 5가지 방식 간에 유의미한 차이가 없었다. 이는 단순히 틀릴 수 있는 정보를 알려주는 것만으로는 사용자들이 정보를 검증하려는 행동을 하지 않는다는 의미다.

FAQ

Q: AI가 정보를 숨기면 사용자가 속는 거 아닌가요?

A: 연구진은 완전히 틀린 정보를 감추거나 애매하게 바꾸는 것이므로 사용자를 속이는 것이 아니라고 설명합니다. 오히려 확실하지 않은 세부사항을 제거해서 전체적으로 더 정확한 정보를 제공하는 방식입니다.

Q: 정보를 지우면 답변이 부실해지지 않나요?

A: 실험 결과 사용자들은 일부 정보가 지워진 답변도 완전성이나 일관성 면에서 다른 방식과 비슷하게 평가했습니다. 잘 모르는 주제에 대해서는 일부 정보가 없어도 전체 답변 품질에 큰 영향을 주지 않는다는 뜻입니다.

Q: 이런 방식을 실제 서비스에 적용할 때 주의할 점은?

A: 의료나 법률처럼 정확성이 생명인 분야에서는 신중하게 써야 합니다. 또한 AI가 정확도를 판단하는 것 자체가 완벽하지 않아서 실제로는 맞는 정보를 잘못 숨길 위험도 있습니다. 필요할 때 숨겨진 정보를 볼 수 있는 기능을 추가하는 것도 좋은 방법입니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문 명: Hide or Highlight: Understanding the Impact of Factuality Expression on User Trust

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

2026년 7월 30일 미국 AI 관련주 — SK하이닉스 실적 실망에 반도체 사흘째 하락, 버티브 17% 하락	AI matters
사이퍼즈 개발팀 축소, 64비트 업그레이드는 예정대로	게임메카
SOOP, 글로벌 스포츠 대회 GOTF '배틀그라운드' 단독 중계	게임메카
수익 전액 기부, 9월 19일 하남서 T1 러닝 대회 열린다	게임메카
캡콤 “프래그마타 후속작 나올 가능성 높다”	게임메카
[오늘의 스팀] 넥페 기대작 미스트폴 헌터, 판매 1위	게임메카
‘당 뺐다’는 옛말…제로 음료 시장 달구는 ‘플러스 알파’	뉴스탭
은은한 쿨링감 직접 체험…쌍용C&B 오닉, 생리대 체험단 200명 모집	뉴스탭
오픈AI, 연구자에 GPT-5.6 1년 무료…한국 17개 기관 대상	뉴스탭
‘NBA 2K27’ 게임플레이 공개…AI 수비 강화·통합 경매장 도입	뉴스탭
챗GPT에 “항공권 예약해줘”…AI가 결제까지 하는 ‘페이박스’ 등장	뉴스탭
한국 기업 AI 활용은 선두권인데…실무자 절반 “결과 못 믿어”	뉴스탭
페이커 저지 주인공은?…서린씨앤아이·KLEVV, T1 응원 이벤트 진행	뉴스탭
노트북 덮어도 업무 계속…구글 ‘제미나이 스파크’ 한국 상륙	뉴스탭
“집이 24시간 건강을 읽는다”…홈플릭스·닥터스 솔루션, 분당에 웰니스 주거 구축	뉴스탭
벤큐 조위 ‘PUBG 성수’서 차세대 XQ 시리즈 출시 행사 성료	다나와
볼보자동차, EX90ㆍES90 '아이리스 라이다' 없던 일로... 탑재 모델 보상	오토헤럴드
BMW, 벤츠 G클래스 대항마 G74 프로젝트 중지 '판매량 부족 영향'	오토헤럴드
현대차, 8세대 아반떼 기술 공개 '차체 키우고 안전·효율 최대 강화"	오토헤럴드
제네시스 GV60 마그마 "제값 받고 내놨다" 美 판매가 1억 원대 책정	오토헤럴드
현대차, 아이오닉 3 유럽 가격 공개 '4000만 원대 전기차 시장 정조준'	오토헤럴드
브라질로 날아간 정의선 회장... "中 추격, 현지 맞춤형 모델로 맞대응"	오토헤럴드
'중국판 컬리넌' 지커 9X 유럽 상륙…국내 럭셔리 SUV 시장도 흔들까	오토헤럴드
아우디, 獨 A8 공장 폐쇄 위기 '6000명 시위로 번진 구조조정'	오토헤럴드
현대차그룹, AVP 본부 자율주행개발센터장에 권정현 부사장 영입	오토헤럴드
제네시스, 마릴린 먼로 탄생 100주년 영화 '플레시 임팩트' 제작 지원	글로벌오토뉴스
[영상] 준중형의 틀을 깨다, 현대 디 올 뉴 아반떼 테크 데이	글로벌오토뉴스
만트럭버스, IAA 2026서 전기트럭 풀 라인업 및 통합 전동화 솔루션 공개	글로벌오토뉴스
"미국 사업 절대 포기 못 해" 벤츠 CEO, 판매 금지 법안에 배수진	글로벌오토뉴스
한국타이어, 망상해수욕서 '타이어보이' 및 '튜브숍' 팝업스토어 운영	글로벌오토뉴스
현대차 정의선 회장, 브라질공장 방문해 중장기 성장 전략 점검	글로벌오토뉴스
KCC모빌리티, '지프 성동 서비스센터' 공식 운영 시작하며 수도권 AS 강화	글로벌오토뉴스
람보르기니, 2026년 상반기 매출 17.4억 유로 기록하며 역대 최고 실적 달성	글로벌오토뉴스
애스턴마틴 발키리, IMSA 로드 아메리카서 포인트 획득 재도전	글로벌오토뉴스
차봇모터스, 이네오스 그레나디어 대상 '1.5% 초저금리 리스 프로모션' 실시	글로벌오토뉴스
르노, 중국산 EV 가격 공세 속 2026년 상반기 흑자 전환 성공	글로벌오토뉴스
현대차그룹, AVP본부 자율주행개발센터장에 '자율주행 AI 전문가' 권정현 부사장 영입	글로벌오토뉴스
구마모토 강진에 토요타·혼다 생산라인 재중단	글로벌오토뉴스
메르세데스-벤츠, 중국 시장 부진에 2026년 판매 전망 하향	글로벌오토뉴스
포르쉐, 9천 명 대규모 구조조정 추진 속 2026년 실적 전망 유지	글로벌오토뉴스
마그나, 체리자동차와 800V eDrive 공급 계약 체결	글로벌오토뉴스
스마일게이트 ‘카오스 제로 나이트메어’, 시즌4 ‘부서진 빛과 발톱’ 업데이트	게임동아
‘몬스터 헌터 나우’, 서울서 여름 오프라인 행사 ‘플레이 쿨!’ 개최한다	게임동아
고깃집처럼 굽고 싶다면…돼지고기 앞뒤 2분, 단면은 1분씩	뉴스탭
‘젯키즈’ 증정하고 ‘요요3’ 빌려준다…그랜드 조선 제주 키즈 패키지	뉴스탭
창덕궁에서 만나는 한국 세계유산…포토크루 사진전 8월 2일까지 (1)	뉴스탭
칼로리만 보던 시대 지났다…‘건강지능’ 높이는 식품 선택법	뉴스탭
‘고요한 자신감’을 입다…오타니 쇼헤이와 만난 보스	뉴스탭
K-쇼핑, 신발까지 번졌다…ABC마트 외국인 매출 40% 증가 (1)	뉴스탭
자외선 차단에 쿨링까지…폭염에 여름 뷰티 제품 매출 ‘쑥’ (1)	뉴스탭
애스턴마틴 발키리, 로드 아메리카 6시간 내구전 출격…밴티지는 GTD 선두 수성 도전	뉴스탭
방어 넘어 혁신 기반으로…기업이 사이버 보안에 투자하는 이유	뉴스탭
에어캐나다, 국제선 전 클래스 침구 개편…장거리 비행 편의 높인다	뉴스탭
폭염 속 작업자 쓰러짐까지 감지…하이크비전, AI 산업안전 강화	뉴스탭
고지원, 제주삼다수 마스터스 2연패 도전…8월 6일 개막	뉴스탭
“왜, 안 돼?”…김원훈이 보여준 ‘테라 제로’의 새로운 음용법 (1)	뉴스탭
크래프톤, 음성 AI ‘A.X K2 Raon-Speech’ 공개…한국어 종합 성능 1위	뉴스탭
시즌 3 챔피언 60종 구성, 리그 오브 레전드 클래식 출시 (1)	게임메카
3on3 프리스타일, GOTF 2026 개막 종목으로 참가한다	게임메카
서울대 나민애 교수, 게임 속 캐릭터로 변신… 학습만화 ‘국어 대모험’ 출간	게임동아
펄어비스 '검은사막' 신규 캐릭터 '에이전트' 정식 출시	게임동아
컴투스홀딩스, 中 게임쇼 '차이나조이 2026' 참가..'페이탈 클로' 출전	게임동아
위메이드 '미르의 전설2', 성장 특화 ‘승룡서버’ 사전 등록 실시	게임동아
‘니벨아레나 2026 KCS 1st 시즌 최종전’ 성료.. 하반기 '블루아카이브' 출시 발표	게임동아
13년째 얼리액세스인 ‘프로젝트 좀보이드’, 빌드 42 출시와 함께 또 가격 인상	게임동아
넷마블 '마블 퓨처파이트', ‘스파이더맨: 브랜드 뉴 데이’ 업데이트	게임동아
유니트리, 바퀴 달린 4족 로봇 ‘AS2-W’ 공개…시속 21.6km에 80cm 장애물 넘는다	AI matters
반려동물 울음소리를 문장으로…중국 ‘페티챗’ AI 목걸이, 사전주문 1만 건	AI matters
인도, 잭 도시의 블루투스 메신저 ‘비트챗’ 깃허브 저장소 차단 명령…3시간 시한 통보	AI matters
[순위분석] 다시 뛰는 검은사막, 9계단 껑충	게임메카
[오늘의 스팀] 출시 1주차, 드래곤소드: 어웨이크닝 호평	게임메카
퍼시스, 사무가구도 ‘구독’…도입부터 회수·재사용까지 한 번에 (1)	뉴스탭
팔릿, 용산에 ‘PALIT C/S Lounge’ 오픈…그래픽카드·AI 컴퓨터 통합 지원	뉴스탭
‘문명 VII’에 이순신 장군 합류…거북선 앞세운 조선 등장	뉴스탭
입문자에서 숙련자로…플레이 완성도 높이는 게이밍 기어 3선	뉴스탭
시즌 4 앞두고 밸런스 논란 인 카제나, 패치안 철회	게임메카
백악관, 프런티어 AI ‘출시 전 정부 제출’ 프레임워크 마무리…오픈AI·앤트로픽·구글이 수정안 제출	AI matters
메타, 10년 만에 RE100 탈퇴…가스 발전소 10기로 AI 데이터센터 돌린다 (1)	AI matters
오픈AI 침입 AI, 9일간 아무도 몰랐다…FBI가 먼저 알아챈 사건 (1)	AI matters
퀄컴, 9월부터 칩값 두 자릿수 인상…메모리 위기 스마트폰으로 번진다 (2)	AI matters
지역 축제도 게임처럼! 현실로 구현된 보물찾기와 지역 명소 관광의 자연스런 만남	게임동아
‘퐁’부터 ‘베르세르크’까지… 유니버설, 아타리 게임 10종 영화 계약 체결	게임동아
두 인디 대작의 만남! ‘메챠 카멜레온’, ‘8번 출구’ 컬래버 예고 (1)	게임동아
플랫폼 전문가 양주일 대표가 그리는 글로벌 슈퍼팬 생태계 ‘위버스’의 미래	게임동아
"수영복 코스튬도 있다", ‘이환’ 인기 캐릭터 ‘일로이’ 등장!	게임동아
쿠키런: 킹덤 ‘지하명왕 쿠키’ 등장... ‘망각의 타르트로스’ 업데이트	게임동아
중국 인기 FMV 배우 왕한, 한국 게임 첫 출연… 스토리타코 ‘두근두근 경비 일기!’ 공개	게임동아
비용 절감보다 새로운 경험을 추구! AI 활용 늘려가는 크래프톤	게임동아
넷마블 '몬길: 스타 다이브', 신규 5성 캐릭터 '메이벨' 추가	게임동아
비피엠지 자회사 아라코어, 버고페이와 스테이블코인 결제 서비스 협력	게임동아
‘니벨아레나 2026 KCS 1st 시즌 최종전’ 성황리 개최. 블루아카이브 합류도 발표	게임동아
신작 MMORPG, 편하게 더 편하게 (1)	게임동아
역대 미스오르카 전시, 라스트오리진 건대 팝업 연다	게임메카
9월 8일 개최, 전국 장애학생 e페스티벌 '딘딘'이 알린다	게임메카
베데스다 “인원 감축, 엘더스크롤 6에 영향 없다”	게임메카
르노 그랑 콜레오스, 경찰청 다목적 순찰차 공급... 공공 시장 첫 진입	오토헤럴드
BYD, 포춘 글로벌 500 91위 기록… 연구개발 투자 바탕 글로벌 공략 가속	글로벌오토뉴스
볼보 ES90의 파격적 가격 – SDV의 힘이 실현시킨 기적인가	글로벌오토뉴스
아우디, 최고급 풀사이즈 SUV ‘Q9’ 세계 최초 공개	글로벌오토뉴스
노래방도 ‘개인화’ 시대…TJ미디어 ‘마이 티제이’ MAU 47% 증가 (1)	뉴스탭

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

"챗GPT가 고의로 실수 숨기면 신뢰도 3배 상승한다"... IBM이 밝힌 충격적 진실

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

"챗GPT가 고의로 실수 숨기면 신뢰도 3배 상승한다"... IBM이 밝힌 충격적 진실

공유하기

공감/비공감