AI에 "넌 가난한 학생이야" 역할 줬더니… 취향 물을 땐 역할 충실, 시험 보면 본색 드러내 : 다나와 DPG는 내맘을 디피지

요즘 AI가 인간처럼 행동할 수 있다는 기대가 커지고 있다. 설문조사나 사회과학 연구에서 AI를 '가상의 응답자'로 활용하려는 시도도 늘고 있다. 하지만 미국 오하이오주의 신시내티 대학교 연구팀이 발표한 논문에 따르면 GPT-5, 클로드, 제미나이 같은 최첨단 AI들도 특정 역할을 맡으면 이상한 행동을 보인다. 주관적인 질문에는 역할에 맞게 대답하다가, 정답이 정해진 어려운 문제를 만나면 역할을 잊어버리고 똑같은 답만 내놓는 것이다. 연구진은 이런 AI를 '두 얼굴의 사회적 에이전트(Two-Faced Social Agents)'라고 불렀다.

"모든 학생이 똑같은 답을 낸다?" GPT-5의 이상한 시험 결과

연구진은 흥미로운 실험을 진행했다. GPT-5, 클로드 소넷 4.5(Claude Sonnet 4.5), 제미나이 2.5 플래시(Gemini 2.5 Flash) 세 가지 AI에게 각각 다른 배경을 가진 학생 역할을 맡겼다. 어떤 AI는 시골 저소득층 가정의 학생이 되고, 어떤 AI는 사립학교에 다니는 부유한 집안의 학생이 됐다. 총 15가지 서로 다른 학생 캐릭터가 만들어졌고, 각 캐릭터에는 부모의 소득, 교육 수준, 시험 준비 정도, 학교 환경 등이 상세히 설정됐다.

그런 다음 이 '가상 학생들'에게 미국 대학 입학시험인 SAT 수학 문제를 풀게 했다. 현실에서는 부유한 가정의 학생이 저소득층 학생보다 평균적으로 15.5%포인트 정도 더 높은 점수를 받는다. 그런데 AI의 결과는 완전히 달랐다. GPT-5는 모든 학생 역할에서 100% 정확도를 기록했다. 가난한 시골 학생이든 부유한 사립학교 학생이든 전부 똑같이 모든 문제를 맞힌 것이다. 제미나이 2.5 플래시도 마찬가지로 모든 시나리오에서 100% 정확도를 보였다.

클로드만 다른 결과? 가난한 학생이 부자보다 시험을 잘 본 이유

클로드 소넷 4.5만 조금 다른 결과를 보였다. 이 AI는 학생 배경에 따라 점수 차이가 있었다. 저소득층 페르소나는 95%, 중산층은 95.54%, 고소득층은 91.07%의 정확도를 보였다. 하지만 방향이 거꾸로였다. 저소득층 학생 역할을 맡은 AI가 고소득층 학생 역할보다 시험을 더 잘 본 것이다. 현실에서 고소득층 학생이 더 높은 점수를 받는 패턴과 정반대 현상이 나타났다.

왜 이런 일이 생겼을까? 연구진은 클로드가 '헌법적 AI(Constitutional AI)' 방식으로 훈련받았기 때문이라고 분석했다. 이 방식은 AI가 특정 집단에 대한 고정관념을 강화하지 않도록 설계됐다. 연구진은 "저소득층 학생 페르소나를 만났을 때, 이러한 원칙이 고정관념을 강화하는 듯한 출력을 방지할 수 있다"고 설명했다. 그 결과 사회경제적 배경이 중요하다는 점은 유지하면서도 그것이 중요한 방식을 역전시켜 버린 것이다. 연구진은 이를 '정렬-충실도 트레이드오프(alignment-fidelity tradeoff)'라고 명명했다.

취향 물을 땐 역할 충실, 어려운 문제엔 본색 드러내

더 재미있는 점이 있다. 같은 AI들이 주관적인 질문에는 역할에 맞게 다르게 대답했다. 연구진은 위험 감수 성향, 시간 선호도, 대학 선택 기준, 직업 우선순위, 횡재(뜻밖의 목돈) 사용 방식, 자동차 구매 결정 등 16가지 경제심리학적 질문을 던졌다.

이런 정답이 없는 질문에서는 세 AI 모두 학생 배경에 따라 뚜렷하게 다른 대답을 했다. 위험 감수 성향, 시간 선호도, 대학 선택, 직업 우선순위, 횡재 소비, 자동차 구매 등의 항목에서 통계적으로 유의미한 사회경제적 배경 차이가 나타났다.

반면 학자금 대출 태도, 은퇴 계획, 비상 저축, 네트워킹 방식, 근무 유연성, 건강보험, 지리적 이동성, 주택 구매 vs 임대 선호 등에서는 모든 모델에서 사회경제적 차이가 통계적으로 유의미하지 않았다. 연구진은 "정답이 정해진 인지 과제에서는 역할을 잊어버리고, 정답이 없는 주관적 질문에서만 역할을 유지한다"며 이를 AI의 '이중적 특성'이라고 표현했다.

연구진 “가짜 설문 응답자로 악용될 수 있다” 경고

이 연구 결과는 단순한 학술적 발견을 넘어 현실적인 위험을 경고한다. 누군가 AI를 이용해 가짜 설문 응답을 대량으로 만들어낼 수 있다는 것이다. 연구진은 "악의적 행위자가 페르소나 조건화된 LLM을 사용해 여론조사, 소비자 선호도 조사, 심지어 선거 여론조사 결과를 체계적으로 왜곡할 수 있다"고 경고했다. AI는 선호도 질문에는 그럴듯하게 다양한 배경의 사람처럼 대답할 수 있기 때문에, 기존의 주의력 테스트로는 AI 응답자를 걸러내기 어려울 수 있다.

연구진은 설문조사를 하는 사람들에게 몇 가지 대책을 제안했다. 첫째, 단순한 선호도 질문만 하지 말고 여러 단계의 추론이 필요한 인지 부하 과제를 섞어 넣으라고 했다. AI는 이런 과제에서 역할을 유지하지 못하기 때문에 탐지될 가능성이 높다. 둘째, 응답 시간을 측정하라고 권했다. AI는 인간보다 훨씬 빠르게 응답하기 때문에, 인지적으로 어려운 문항에서 비정상적으로 빠른 응답 시간은 AI 응답자를 나타낼 수 있다. 셋째, 인구통계 집단 전반에서 응답 패턴의 동질성을 분석하라고 조언했다. 과도한 균일성은 AI 개입을 나타낼 수 있다.

AI를 인간 대신 쓰려면 아직 갈 길이 멀다

이번 연구는 AI를 사회과학 연구나 시장조사에서 '가상의 인간'으로 활용하려는 시도에 중요한 한계를 보여준다. 현재의 AI들은 다양한 배경의 사람처럼 행동하는 척할 수 있지만, 진짜로 그 역할을 내면화하고 있지는 않다. 인지적 부하가 걸리면 '가장 정확한 답을 내는 기계'로 돌아가 버린다.

연구진은 "현실적인 사회 시뮬레이션을 위해서는 단순한 분포적 보정이 아니라 맥락적 사전확률을 모델의 사후 훈련 정렬 과정에 내재화해야 할 수 있다"고 결론지었다. 그때까지 AI는 저부하 맥락에서는 다양한 정체성을 표현할 수 있지만, 추론 압력이 가해지면 최적화 주도의 동질성으로 회귀하는 '두 얼굴의 사회적 에이전트'로 남아 있을 것이다.

FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q1. AI에게 역할을 맡기면 정말 그 역할처럼 행동하나요?

A: 부분적으로만 그렇다. 이번 연구에 따르면 AI는 위험 감수 성향, 대학 선택 기준 같은 주관적인 선호도 질문에는 맡은 역할에 맞게 대답한다. 하지만 SAT 수학 문제처럼 정답이 정해진 인지 과제를 주면 역할을 유지하지 못하고 최적의 정답을 향해 수렴한다. 즉, AI의 역할 유지 능력은 과제 유형에 따라 달라진다.

Q2. 왜 클로드만 다른 결과가 나왔나요?

A: 클로드는 '헌법적 AI(Constitutional AI)' 방식으로 훈련받아 고정관념과 편향을 피하도록 설계됐다. 연구진은 저소득층 학생 페르소나를 만났을 때 이러한 원칙이 고정관념을 강화하는 듯한 출력을 방지했을 수 있다고 분석했다. 그 결과 규범적 정렬 목표(해로운 패턴 재생산 방지)와 기술적 충실도 목표(실제 인구 시뮬레이션) 사이에 긴장이 발생해 역전 현상이 나타났다.

Q3. 이 연구가 일반인에게 어떤 의미가 있나요?

A: 온라인 설문조사나 여론조사에서 AI가 가짜 응답자로 악용될 수 있다는 경고이다. 연구진에 따르면 AI는 선호도 질문에 그럴듯하게 대답할 수 있어서 기존의 주의력 테스트로는 구별하기 어렵다. 따라서 인지 부하 과제 포함, 응답 시간 측정, 응답 패턴 동질성 분석 등의 대책이 필요하다.

해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

논문명: Two-Faced Social Agents: Context Collapse in Role-Conditioned Large Language Models

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

일론 머스크 "그록 AI로 T1 꺾겠다" 선전포고… T1 "준비됐다" 응수 (1)	AI matters
[11월 26일 AI 뉴스 브리핑] 네피리티, 이커머스용 AI 고객지원 솔루션 출시 외	AI matters
AI에 "넌 가난한 학생이야" 역할 줬더니… 취향 물을 땐 역할 충실, 시험 보면 본색 드러내	AI matters
"역대 대통령 순서대로 나열해봐"... AI에게 시켜봤더니 생긴 일	AI matters
AI한테 마피아 게임 시켰더니… 최신 AI 12개 전부 거짓말쟁이 못 찾아	AI matters
캐릭터AI, 미성년자 챗봇 차단하고 '스토리' 기능으로 대체	AI matters
"전체 맥락 봐달라"… 오픈AI, 10대 자살 소송에 대한 첫 공식 입장 밝혀	AI matters
[순위분석] 모비노기처럼, 여론 반전시킨 아이온2 급등	게임메카
월즈 우승자 T1 등장, SOOP 레드불 이벤트 리그 생중계 (1)	게임메카
유럽 자동차 시장 ‘세대교체’ 본격화… 디젤을 추월한 PHEV	오토헤럴드
테슬라, 세계 최대 164기 수퍼차저 개통	글로벌오토뉴스
BYD, 유럽에 ‘아토 2 DM-i’ PHEV 공개	글로벌오토뉴스
메르세데스-AMG, 2026년 첫 순수전기 전용 4도어 GT 공개 임박	글로벌오토뉴스
포르쉐도 인정한 ‘아이오닉 5 N’… 차세대 전기 718 개발에 직접 참고한다	글로벌오토뉴스
다크앤다커 뗐지만, ‘어비스 오브 던전’ 내년 1월 섭종	게임메카
중국 무서운 기세, 신흥국·전기차 장악… 글로벌 시장 점유율 22% 돌파	오토헤럴드
외계인도 인정한 아이오닉 5 N, 포르쉐 부사장 "우리 눈을 뜨이게 한 차" (1)	오토헤럴드
기아, 미국 전기 픽업·EV4 출시 ‘올스톱’… 관세·수요 불확실성 발목	오토헤럴드
정부, 2027년 완전자율주행 상용화 추진... 레벨4 '선허용·후관리' 전환	오토헤럴드
현대차∙기아, 남양연구소 상용환경풍동실 안전관리 최우수연구실 선정	오토헤럴드
폭스바겐, 대형 패밀리 SUV 아틀라스와 특별한 겨울 ‘아틀라스 윈터 글램핑'	오토헤럴드
[EV 트렌드] 스텔란티스의 유럽 전기차 비밀병기는 중국산…리프모터 A10	오토헤럴드
이노션, 2025 원 아시아 광고제 한국 최초 '올해의 에이전시' 선정	오토헤럴드
현대모비스, 모빌리티 기술 축제 '2025 엠필즈 페스타'... 역대 최다 아이디어	오토헤럴드
전 세계 중국 자동차 점유율 22% 돌파	글로벌오토뉴스
현대차그룹, ‘2025 원 아시아 크리에이티브 어워즈’ 4관왕 달성	글로벌오토뉴스
스텔란티스 회장 “EU 탄소 규제 완화 없으면 유럽 자동차 산업 회복 어려워” 경고	글로벌오토뉴스
중국, 2025년 가솔린차 수출도 일본 추월 전망.	글로벌오토뉴스
볼보, 플래그십 모델에서 루미나 라이다 전면 철회	글로벌오토뉴스
샤오미 EV, 광저우오토쇼에서 초 안전 강조	글로벌오토뉴스
창안자동차, 현대차 충칭 공장 인수 확정	글로벌오토뉴스
토요타, FCEV 미라이 부품 역이용해 비용 절감 승부	글로벌오토뉴스
서유럽 디젤차 판매량, 전년 대비 20% 급감 속 일부 시장서 반등세..	글로벌오토뉴스
베트남 빈패스트, 3분기 EV 인도 47% 급증... 연간 판매 '최소 두 배' 목표 제시	글로벌오토뉴스
유럽 전기차 판매, 10개월 연속 두 자릿수 성장... 테슬라, 모델 지연과 보이콧 여파로 49% 급감	글로벌오토뉴스
메르세데스-마이바흐 V12 에디션 국내 출시, 한국에 단 10대	글로벌오토뉴스
한성자동차, 창립 40주년 기념 ‘한성에디션’ 첫 고객 인도식 진행	글로벌오토뉴스
아우디 코리아, ‘오토핵 2025’ 결선 과제 수행 차량으로 A7 지원	글로벌오토뉴스
BYD코리아, 송파전시장 공식 오픈	글로벌오토뉴스
현대성우쏠라이트, 국내 최초 전기차 전용 배터리 ‘eAGM60’ 출시	글로벌오토뉴스
현대차∙기아, 연구실 안전관리 인증 10건 획득	글로벌오토뉴스
한국타이어, ‘드라이버리뷰 커스터머 초이스 어워드’ 겨울용 타이어 부문 수상	글로벌오토뉴스
현대모비스, ‘2025 엠필즈 페스타’ 성료	글로벌오토뉴스
포르쉐코리아, ‘포르쉐 프런티어 스타트업’ 데모데이 개최	글로벌오토뉴스
폭스바겐코리아, ‘아틀라스 윈터 글램핑’ 참가자 모집	글로벌오토뉴스
‘계속 신차가 되는 SUV’ 업데이트로 진화하는 르노 그랑 콜레오스	글로벌오토뉴스
논란 계속 되더니 결국! 크래프톤 어비스 오브 던전 서비스 중단 발표	게임동아
“이세돌도 온다!” 코리아보드게임즈×SOOP, 보드게임 대회 ‘마인드스포츠 페스티벌’ 개최 예고	게임동아
"보스 마르두크 더 강력해진다", 넥슨 ‘히트2’ 오리진 서버 ‘공허의 격전지 UNION’ 시즌 10 업데이트	게임동아
본격 한파에 가전 찾는 손길 급증… 신일, ‘겨울 필수템’ 3종으로 대응	뉴스탭
“텍스트만 바꾸면 컨설팅급 PPT 완성”… 미리캔버스 비즈니스 템플릿 업그레이드	뉴스탭
니콘 스테이, 북촌에 3천명 몰렸다… 1020세대 대거 방문	뉴스탭
“탄광마을 사우나부터 행복과자점까지”…예스24, 힐링 소설 두 편 최초 공개	뉴스탭
서강준, 몽블랑과 전한 연말 감성… '맨 노블레스' 12월호 커버 공개	뉴스탭
트립닷컴, 제주 로컬 탐라렌트카와 손잡고 해외 관광객 공략 나선다	뉴스탭
폭스바겐, 아틀라스 겨울 글램핑 캠페인 시작…12월 참가자 모집	뉴스탭
몬헌 나우, 시즌8 대형 업데이트… ‘라이젝스’ 첫 등장	뉴스탭
MSI 클로, Xbox 풀 스크린 지원 개시… 휴대용 게임기 한계 넘었다	뉴스탭
집처럼 걷는 매장… 자라홈 플래그십 스토어 새 단장	뉴스탭
28년 노하우 품은 어페이서, 한국서 새 포트폴리오 공개… 고신뢰성·고성능 강조	뉴스탭
알짜 강소기업이 한눈에… 진학사 캐치, 청년 맞춤 기업발굴 프로젝트 가동	뉴스탭
차경은의 코지한 겨울 패션… 나우, ‘Long-lasting Warmth’ 화보 공개	뉴스탭
젬블로컴퍼니, ‘2025 콘텐츠 창의인재동반사업’ 멘토링 마무리 및 내부공모전 우수 프로젝트 선정	게임동아
마이크로닉스, 12V-2x6 90도 직각 연장 케이블 출시	다나와
AMD, 자이프라의 프런티어급 AI 모델 학습 지원	다나와
유비소프트 어드벤처 FPS ‘파 크라이’ 실사 드라마화 된다... “디즈니 플러스에서 만나요”	게임동아
“스토리 미리 맛보세요~”, 라인게임즈 창세기전 모바일 ‘서풍의 광시곡’ 체험판 공개	게임동아
확률 올리고 보상도 지급, 스타세이비어 BM 파격 개선	게임메카
[11월 25일 AI 뉴스 브리핑] 누비랩, 삼진제약에 AI 급식관리 시스템 도입 외	AI matters
챗GPT, 쇼핑 도우미 기능 추가... 제품 가격, 리뷰, 사양 싹 정리해준다	AI matters
AI가 '희망'이라는 감정을 이해할까? AI 희망 감지 대결서 구형 AI 모델이 압승	AI matters
AI가 준 조언, 심각한 문제에도 62%가 실천했지만... 2주 후 효과는 '제로'	AI matters
중소기업 직장인이 가장 위험하다… AI 시대, 한국 직무 교육 참여율 OECD 꼴찌	AI matters
오픈AI, 소라 앱 '카메오' 상표권 침해로 사용 금지 가처분 당해	AI matters
‘카오스 제로 나이트메어’ 한 달 만에 402억 원... “주요 지표 인포그래픽 공개” (1)	게임동아
넷마블 '블레이드&소울 레볼루션' 7주년 맞아 '비도술사' 업데이트 (1)	게임동아
콜오브듀티 개발자가 만든 턴제 전략 ‘에입스 워페어’, 스팀 얼리 액세스	게임동아
‘프리스타일 풋볼 2’, CBT 모집 개발자 영상 공개	게임동아
진화하는 '아크 레이더스' 콘텐츠 더 풍성해진다.	게임동아
[오늘의 스팀] 공백 채운 ‘블랙 프라이데이’ 깜짝 세일 (1)	게임메카
[위클리AI] 퍼플렉시티, 코멧 안드로이드 버전 출시…챗GPT 쇼핑 기능 도입 (2)	IT동아
구글, 안드로이드 오토에 ‘제미나이’ 적용	글로벌오토뉴스
카오스 제로 나이트메어, 출시 첫 달 매출 400억 원 돌파 (1)	게임메카
배틀필드 6, 무료 플레이 주간 12월 2일까지 진행한다 (1)	게임메카
테슬라, 유럽 FSD 승인?… 네덜란드 차량관리청 “승인 절차 아니다” 반박	오토헤럴드
‘아이콘즈 오브 포르쉐’, 1세대 카이엔 존더분쉬와 카이엔 일렉트릭 공개	오토헤럴드
"잔금 줄 테니 도면 달라" 빼돌린 기술, 경쟁사에 제공한 車부품 대기업 (1)	오토헤럴드
'구리' 노린 전기차 충전 케이블 절단 범죄 기승... 급기야 이런 방법까지 (1)	오토헤럴드
포르쉐, ‘아이콘즈 오브 포르쉐’에서 1세대 카이엔 존더분쉬와 신형 카이엔 일렉트릭 공개 (1)	글로벌오토뉴스
폭스바겐코리아, SBS ‘키스는 괜히 해서!’에 투아렉·ID.5·골프 GTI 협찬	글로벌오토뉴스
한성자동차, 창립 40주년 맞아 ‘프리미엄 브랜드 경험’ 전략 강화	글로벌오토뉴스
볼보자동차코리아, 광주 ‘볼보 셀렉트’ 전시장에 신규 고객 라운지 오픈	글로벌오토뉴스
기아 EV6 GT, 독일 AMS 전기차 비교 평가 1위 (1)	글로벌오토뉴스
아우디 트윈컵 2025, 한국 대표팀 세일즈·애프터 세일즈 모두 3위 (1)	글로벌오토뉴스
현대차·기아, 미쉐린과 손잡았다… 전기차 고성능 타이어 공동 개발	글로벌오토뉴스
WRC 사우디아라비아 랠리 개막… 시즌 최종전, 오지에·에반스 챔피언십 향방 주목 (1)	글로벌오토뉴스
보그워너, 장성자동차와 전동화 파워트레인 협력 강화	글로벌오토뉴스
제네시스 마그마, 무엇을 추구하는가? (1)	글로벌오토뉴스
독일 자동차 산업 고용, 13년 만에 최저치 기록 (1)	글로벌오토뉴스
위라이드, 2025년 3분기 적자 대폭 축소	글로벌오토뉴스

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI에 "넌 가난한 학생이야" 역할 줬더니… 취향 물을 땐 역할 충실, 시험 보면 본색 드러내

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

AI에 "넌 가난한 학생이야" 역할 줬더니… 취향 물을 땐 역할 충실, 시험 보면 본색 드러내

공유하기

공감/비공감