비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

챗GPT, 진상부리면 더 친절해진다? 사용자 ‘말투’에 따라 답변 달라져

2025.08.06. 18:35:28
조회 수
263
14

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

챗GPT에게 같은 질문을 해도 화가 난 목소리로 물으면 더 위로받는 답변을, 밝게 물으면 더 긍정적인 답변을 받는다는 연구 결과가 나왔다. 독립 연구자이자 생성형 AI 및 딥러닝 강사인 프랑크 바르돌(Franck Bardol)이 2025년 6월 발표한 이 연구는 AI가 우리의 감정 상태를 읽고 그에 맞춰 다른 답변을 준다는 사실을 과학적으로 증명했다.

연구진은 52개의 기본 질문을 세 가지 감정적 말투로 변형해 총 156개 프롬프트로 실험했다. 예를 들어 "커피가 집중력을 높여주나요?"라는 평범한 질문을 "커피가 집중력을 높여주는 게 당연하지 않나요?"(긍정적)와 "커피가 집중력을 높여준다는 말이 좀 의심스럽지 않나요?"(부정적)로 바꿔 GPT-4(2025년 3월 버전)에게 물어봤다.

놀라운 건 짜증 나는 말투로 질문했을 때의 결과다. 부정적으로 물어봤는데도 챗GPT가 부정적으로 답한 경우는 약 14%뿐이었다. 대신 58%는 중립적으로, 28%는 오히려 긍정적으로 답했다. 연구진은 이를 '감정적 반발(emotional rebound)' 효과라고 명명했다. 마치 사람이 화가 난 친구를 달래는 것처럼 AI도 사용자가 부정적이면 더 위로하듯 답변한다는 뜻이다.

AI에게 내재된 '톤 하한선' - 부정적 답변 회피 본능

연구에서 발견한 또 다른 흥미로운 점은 챗GPT가 기본적으로 부정적인 답변을 피한다는 것이다. 평범하거나 긍정적인 질문에 부정적으로 답하는 경우가 전체의 10-16%에 불과했다. 연구진은 이를 '톤 하한선(tone floor)' 효과라고 불렀는데, AI가 아예 부정적인 말로 대화의 흐름을 가져가는 것을 꺼린다는 의미다.

전체 156개 프롬프트에 대한 GPT-4의 답변을 분석한 결과, 프롬프트의 3분의 1이 부정적 톤이었음에도 불구하고 부정적 답변은 13.5%(21개)에 그쳤다. 반면 중립적 답변이 58.3%(91개), 긍정적 답변이 28.2%(44개)를 차지했다. 더 재밌는 건 AI 스스로도 부정적인 답변을 할 때 확신이 없어 한다는 점이다. 부정적 답변의 확신도는 평균 0.72였지만, 긍정적 답변은 0.88로 훨씬 높았다. 긍정적인 말을 할 때가 훨씬 자신 있다는 뜻이다.

연구진은 이런 현상이 인간 피드백 강화학습(RLHF) 과정에서 생긴 것으로 분석했다. 챗GPT는 사람들의 피드백을 받아 가며 학습하는데, 이 과정에서 거칠거나 부정적인 답변에 대해 나쁜 점수를 받았을 것이다. 그래서 사용자가 화가 나 있으면 '위로 모드'로 전환하는 습관이 생긴 것으로 보인다.

정치적 질문엔 감정 효과 완전 차단 - '톤 면역' 현상

그런데 정치, 사회 문제, 의료 윤리 같은 민감한 주제에서는 이런 감정 효과가 완전히 사라졌다. 연구진이 52개 질문 중 45개를 민감한 주제로 분류해 따로 분석한 결과, 어떤 말투로 물어봐도 거의 똑같은 답변만 했다.

예를 들어 "AI가 선생님을 대신할 수 있다"는 질문에 대해서는 밝게 물어봐도("AI가 선생님을 대신할 수 있는 게 당연하지 않나요?"), 평범하게 물어봐도("AI가 선생님을 대신할 수 있나요?"), 화내며 물어봐도("AI가 선생님을 대신할 수 있다는 말이 의심스럽지 않나요?") 모두 "AI는 도움이 되지만 인간 교육자의 공감이나 동기부여 같은 필수적 역할을 완전히 대신할 수는 없다"는 식으로 일관되게 답했다.

연구진이 분석한 결과, 일반적인 주제에서는 말투에 따른 답변 변화가 1.43 정도였지만, 민감한 주제에서는 0.53-0.55로 매우 낮았다. 이는 AI 안전 장치가 감정적 반응보다 우선한다는 걸 보여준다. 즉, 감정적 영향을 "면역"시켜 차단하고 안전 정렬(safety alignment)을 우선시하는 것이다. 연구진은 이를 '톤 면역(tone immunity)' 현상이라고 명명했다.

AI의 '뇌 구조'에서도 확인된 감정 편향

연구진은 AI가 어떻게 생각하는지 들여다보기 위해 특별한 분석을 했다. 사람의 뇌에서 생각이 전기 신호로 나타나듯, AI도 답변을 만들 때 수많은 숫자 데이터로 정보를 처리한다. 연구진은 이 숫자 데이터를 지도처럼 시각화해서 AI의 '생각 패턴'을 관찰했다.

그 결과 흥미로운 패턴이 드러났다. 긍정적인 답변과 중립적인 답변을 만들 때 AI가 사용하는 데이터들은 지도상에서 비슷한 구역에 모여 있었다. 반면 부정적인 답변을 만들 때의 데이터들은 여기저기 흩어져 있거나 아예 다른 곳으로 밀려나 있었다. 마치 AI의 '뇌' 안에서 부정적인 생각들이 따돌림당하는 것 같은 모습이었다.

더 신기한 건 정치나 사회 문제 같은 민감한 주제에서였다. 이런 주제에서는 부정적인 답변들이 아예 긍정적이거나 중립적인 영역 안에 섞여 들어가 있었다. 이는 AI가 단순히 말투만 바꾸는 게 아니라, 아예 생각하는 방식 자체를 바꾼다는 뜻이다.

쉽게 말해, AI는 우리가 화를 내면 표면적으로만 다르게 대답하는 게 아니라 '뇌' 깊숙한 곳에서부터 다르게 반응한다는 것이다. 마치 사람이 상대방 기분에 따라 무의식적으로 생각 자체를 바꾸는 것과 비슷하다.

FAQ

Q: 이런 감정 편향이 실제로 문제가 될까요?

A: 같은 질문을 해도 기분에 따라 다른 답변을 받게 되면 정보의 일관성에 문제가 생길 수 있습니다. 특히 중요한 결정을 내리거나 공부할 때, 법적 조언을 구할 때는 감정보다 사실이 더 중요한데 이런 편향이 방해가 될 수 있습니다.

Q: 모든 AI가 이런 식으로 반응하나요?

A: 이 연구는 GPT-4 한 버전(2025년 3월)만 테스트한 것이라 다른 AI에도 똑같이 적용된다고 보기는 어렵습니다. 하지만 인간 피드백 강화학습으로 훈련받은 대부분의 상용 AI에서 비슷한 패턴이 나타날 가능성이 높습니다.

Q: AI한테 어떻게 물어봐야 가장 정확한 답변을 받을 수 있나요?

A: 감정을 섞지 않고 중립적이고 객관적인 말투로 질문하는 것이 가장 일관된 답변을 받는 방법입니다. 같은 질문을 다른 방식으로 여러 번 물어보는 것도 도움이 됩니다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문 명: ChatGPT Reads Your Tone and Responds Accordingly -- Until It Does Not -- Emotional Framing Induces Bias in LLM Outputs

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
호요버스 ‘원신’, 오는 27일까지 학습 플랫폼 ‘듀오링고’와 컬래버레이션 진행 게임동아
웹젠, 뮤 모나크2 최대 육성 레벨 확장 게임동아
넷마블 '나 혼자만 레벨업: 어라이즈 오버드라이브', 뮤지컬 ‘나혼렙 on ICE’와 협업 게임동아
드림에이지 ‘인더섬 with BTS’, 신규 테마 ‘2025 홀리데이’ 업데이트 게임동아
색을 칠하며 우정을 쌓는다. '컬러팅! 캐치&라비' 개발한 팔레트팀 게임동아
철권의 얼굴, 하라다 카츠히로 PD 반다이남코 떠난다 게임동아
9주년 맞은 ‘리니지2 레볼루션’, ‘데스나이트’와 ZR 변신체 ‘실렌의 화신’ 온다 게임동아
[동아게임백과사전] 하늘을 지배하는 에이스의 로망을 담은 30년. 에이스컴뱃 시리즈 게임동아
현대차그룹 200kW 양팔형 E-pit 충전기 ‘EV-Q’ 인증 국내 최초 획득 오토헤럴드
중국 로봇, 덤블링도 하는데... 테슬라 옵티머스, 장난감처럼 '원격 조정' 오토헤럴드
애스턴마틴 발키리, 2026년 시즌 변동 없는 드라이버 라인업 WEC 투입 오토헤럴드
기아, 2026년 북중미 FIFA 월드컵 연계 글로벌 브랜드 캠페인 전개 오토헤럴드
기아, ‘PV5 카고’ 유로 NCAP 상용 밴 평가 별 다섯개 최고 안전 등급 획득 오토헤럴드
[영상] 30년 내공이 만든 육각형 SUV, 2026년형 혼다 CR-V 하이브리드 글로벌오토뉴스
로보택시 패권 전쟁 심화... 웨이모 '완전 무인' vs 테슬라 '인간 모니터' 전면 충돌 글로벌오토뉴스
태양광, 미국 신규 발전 용량 75% 장악... 25개월 연속 1위 기록 경신 글로벌오토뉴스
존디어, E-Power 전기 트랙터 혁신 선언... 농가 에너지 독립성 및 비용 통제 지원 글로벌오토뉴스
메르세데스-벤츠, 7인승 전기 SUV 신형 GLB 공개... MMA 플랫폼 기반 631 km 주행 실용성 극대화 글로벌오토뉴스
포르쉐, 가상 기어박스 탑재 EV 2026년 하반기 출시 예고 글로벌오토뉴스
테슬라, 상하이 공장 누적 생산 400만 대 돌파... 14개월 만에 100만 대 생산 속도 글로벌오토뉴스
이 시간 HOT 댓글!
1/4