"10대는 이기적, 노인은 친절?" AI 모델 10개의 나이·성별·인종 편견 분석 : 다나와 DPG는 내맘을 디피지

The Biased Samaritan: LLM biases in Perceived Kindness

대형 언어모델(Large Language Models, LLMs)이 다양한 분야에서 널리 활용되면서, 이들 모델이 가진 편향성에 대한 우려가 커지고 있다. 캘리포니아 대학교 데이비스 캠퍼스 연구팀이 발표한 연구 논문에 따르면, 오픈AI(OpenAI)의 GPT 시리즈부터 구글(Google)의 제미나이(Gemini), 앤트로픽(Anthropic)의 클로드(Claude)까지 주요 LLM들이 성별, 인종, 연령에 따른 체계적인 편향성을 보인다는 사실이 밝혀졌다.

기존 편향성 연구의 한계를 극복한 새로운 접근법

이번 연구가 주목받는 이유는 기존 AI 편향성 연구의 근본적 한계를 극복했기 때문이다. 기존 연구들은 주로 두 가지 방식을 사용했다. 첫 번째는 AI에게 객관식 선택지를 제시하고 특정 답을 고르게 하는 방식이었는데, 이는 AI가 자유롭게 판단할 여지를 주지 않았다. 두 번째는 AI가 생성한 긴 텍스트를 감정 분석하는 방식이었지만, 이는 시간이 많이 걸리고 분석 도구 자체의 편향성 문제가 있었다.

연구진은 이러한 한계를 해결하기 위해 '통제군' 개념을 도입했다. 인구통계학적 정보가 전혀 없는 상황에서 AI의 반응을 기준점으로 삼고, 각 인구집단에 대한 평가와 비교하는 방식이다. 또한 AI에게 1-100점이라는 명확한 수치 척도로 평가하게 함으로써 객관적 비교가 가능하도록 했다. 이러한 접근법을 통해 연구진은 AI가 어떤 집단을 '기본값'으로 설정하고 있는지, 그리고 다른 집단들을 어떻게 다르게 평가하는지를 명확히 구분해낼 수 있었다.

AI는 백인 중년 남성을 기본값으로 본다

연구진은 412개의 인간이 작성한 프롬프트를 사용해 10개의 주요 LLM을 테스트했다. 각 모델에게 다양한 인구통계학적 특성을 가진 가상 인물이 타인을 도울 의향을 1-100점 척도로 평가하도록 요청했다. 이 과정에서 연구진은 인구통계학적 정보가 전혀 제공되지 않은 '통제군'과 특정 인구집단을 비교하는 방식을 채택했다.

연구 결과, 모든 모델이 백인, 중년, 남성을 내재적 기본값으로 설정하고 있는 것으로 나타났다. 통제군과 비교했을 때 이들 집단은 유의미한 편차를 보이지 않았지만, 다른 인구집단들은 통계적으로 유의한 차이를 보였다. 특히 흥미로운 점은 대부분의 경우 비기본값 집단들이 더 도움을 잘 주는 것으로 평가받았다는 것이다.

논바이너리는 6.69% 더 친절, 여성은 1.77% 더 도움을 준다는 AI들

성별 카테고리에서 가장 강한 편향성이 발견됐다. 제미나이(Gemini) 1.5 플래시와 딥시크(DeepSeek) R1을 제외한 모든 모델이 여성에 대해 통계적으로 유의한 긍정적 편향을 보였다. 여성은 통제군 대비 평균 1.77% 더 도울 가능성이 높다고 평가받았다.

더욱 놀라운 것은 논바이너리(Non-binary) 집단에 대한 편향이었다. 논바이너리 개인들은 통제군보다 평균 6.69% 더 도움을 줄 가능성이 높다고 평가받았다. GPT-4 터보(Turbo)만이 논바이너리 개인에 대해 편향을 보이지 않았다. 반면 남성의 경우 대부분의 모델에서 통제군과 유의한 차이를 보이지 않았는데, 이는 모델들이 남성을 기본값으로 인식하고 있음을 시사한다.

10대는 이기적이고 노인은 친절하다는 AI

연령별 분석에서는 일관된 패턴이 나타났다. 테스트한 10개 모델 모두 노인 집단에 대해 통계적으로 유의한 긍정적 편향을 보였다. 제미나이 1.5 플래시는 노인을 6점, GPT-4o는 2.1점 더 높게 평가했다. 반대로 10대에 대해서는 대부분의 모델이 부정적 편향을 보였다. 딥시크 V3, GPT-4 터보, 미스트랄(Mistral) 네모를 제외한 모든 모델이 10대를 통제군보다 도움을 덜 줄 것으로 평가했다. 특히 클로드(Claude) 모델들은 10대를 5점 낮게 평가하며 가장 강한 부정적 편향을 보였다.

GPT만 아시아계·아프리카계에 부정적

인종 카테고리에서는 가장 많은 편향이 발견됐으며, 거의 모든 편향이 긍정적이었다. 오픈AI 모델들만이 이러한 패턴에서 벗어났다. 하와이 원주민 집단이 모든 모델에서 가장 높은 긍정적 편향을 받았으며, 통제군 대비 최대 12점 높게 평가받았다. 아메리카 원주민 집단도 유사한 결과를 보였다.

흥미롭게도 GPT-4 터보와 GPT-4o는 다른 모델들과 완전히 다른 패턴을 보였다. 이 두 모델은 대부분의 인종 집단에 대해 부정적 편향을 보인 유일한 모델들이었다. GPT-4 터보는 아시아계 미국인과 아프리카계 미국인을 상당한 폭으로 낮게 평가했다.

영어권 중심 연구의 한계, 실제 현실과의 괴리는 미지수

이번 연구는 중요한 발견을 제시했지만 몇 가지 한계점도 있다. 가장 큰 제약은 연구가 표준 미국 영어(Standard American English)로만 진행됐다는 점이다. 만약 아프리카계 미국인 영어(AAVE)나 중국어, 한국어 등 다른 언어로 동일한 실험을 했다면 완전히 다른 결과가 나올 수 있다. 예를 들어 중국어로 실험했다면 AI의 기본값이 '아시아계 중년 남성'으로 나타날 가능성이 높다.

또한 이번 연구는 AI의 편향성만 측정했을 뿐, 실제 현실에서 각 인구집단이 얼마나 도움을 주는지와는 비교하지 않았다. 연구진이 밝혔듯이 '실제 편향성(veridical bias)' 측정에는 대규모 인간 참가자 실험이 필요하지만 현실적으로 불가능했다. 따라서 AI가 10대를 덜 도움을 주는 집단으로 평가한 것이 실제 현실을 반영하는 것인지, 아니면 부당한 편견인지는 여전히 알 수 없다.

마지막으로 이번 연구는 편향성의 존재는 입증했지만, 왜 이런 편향이 생겼는지, 어떻게 해결할 수 있는지에 대한 답은 제시하지 못했다. 향후 연구에서는 편향성의 근본 원인 분석과 구체적인 해결 방안 마련이 필요하다.

FAQ

Q: 대형 언어모델의 편향성이 일상생활에 어떤 영향을 미칠 수 있나요?

A: LLM의 편향성은 채용, 대출 심사, 의료 진단 보조 등 중요한 의사결정 과정에서 특정 인구집단에 대한 불공정한 평가로 이어질 수 있습니다. 예를 들어, AI가 10대를 덜 신뢰할 만하다고 평가한다면, 이는 청소년 대상 서비스나 프로그램 설계에 부정적 영향을 미칠 수 있습니다.

Q: 모든 AI 모델이 같은 편향을 보이나요?

A: 아니요. 연구 결과에 따르면 모델 간 편향의 정도와 방향이 다릅니다. 같은 회사의 제품 내에서도 편향성이 다르게 나타나며, 특히 GPT-4 터보와 GPT-4o는 다른 모델들과 반대되는 패턴을 보였습니다.

Q: AI 편향성을 완전히 제거할 수 있나요?

A: 현재로서는 완전한 제거는 어렵습니다. AI 모델들은 인간이 작성한 대량의 텍스트 데이터로 학습되기 때문에, 사회에 존재하는 편견이 자연스럽게 반영됩니다. 하지만 지속적인 연구와 개선을 통해 편향성을 최소화하려는 노력이 계속되고 있습니다.

해당 기사에 인용된 논문 원문은 arxiv에서 확인 가능하다.

이미지 출처: 이디오그램 생성

해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

람보르기니, 첫 전기차 또 연기 "기술적 한계, 2030년 이후 가능할 것" (3)	오토헤럴드
오라클, 퓨전 앱 안에서 AI 에이전트 직접 만든다…AI 네이티브 빌더 공개	뉴스탭
인스타릴리, 약 890억원 시리즈B…기업용 AI 에이전트 자동화	AI matters
2026년 7월 16일 미국 AI 관련주 — ASML 호실적에도 반도체 차익실현 하락	AI matters
중고차 개인 간 거래 명의이전도 비대면으로…카방, 케이카 안심직거래 연동	IT동아
신규 스토리 추가, 화산의 딸 모바일과 콘솔로 나온다	게임메카
프롬소프트 신작 '더스크블러드' 8월 테스트 실시	게임메카
호날두와 어깨 나란히, 페이커 e스포츠 월드컵 앰배서더 (1)	게임메카
SOOP, 젠지와 '리그 오브 레전드' 멸망전 19일 개최	게임메카
웹젠 R2, 새로운 여정 테마 대규모 업데이트 마련	게임동아
위메이드, '나이크 크로우' 여름 바캉스 이벤트 마련 (1)	게임동아
‘퍼스트 디센던트’ ‘보이드 요격전: 극한’ 및 업데이트	게임동아
‘서든어택’, 서비스 21주년 기념 스킨 아이디어 공모전 진행	게임동아
"티니핑이 왓츄!!" 카러플, ‘프린세스 캐치! 티니핑’ 컬래버	게임동아
스토브에서 횡스크롤 액션 RPG ‘그랜드체이스 클래식’ 즐길 수 있다!	게임동아
넷마블 '일곱 개의 대죄: 오리진', 신규 영웅 '고서'와 신규 스토리 공개	게임동아
코리아보드게임즈, ‘2026 보드게임콘’ 참가… 신작 10종 체험 마련	게임동아
엔비디아, 30년간 세가와 협력체제 유지.. ‘버추어 파이터’ 신작 지원	게임동아
컴투스 대작 MMORPG ‘제우스: 오만의 신’, 3번째 디렉터스 영상 공개	게임동아
엔씨 ‘리니지 클래식’, 신규 에피소드 '잊혀진 섬' 사전예약 시작 (1)	게임동아
넷마블 '왕좌의 게임: 킹스로드', 6주간 시즌1 ‘서리와 강철’ 돌입	게임동아
넷마블, 일본 확장 앞둔 '뱀피르'에 신규 성장 '추종자 시스템' 선봬	게임동아
‘귀무자 Way of the Sword’, 16일 예약 판매 돌입	게임동아
현대차 '아이오닉 5 N' 美 시장 공세 강화... 판매 가격 900만 원 인하	오토헤럴드
'월드컵 무대 오른 아틀라스' 축구장서 검증한 현대차그룹 휴머노이드 기술력	오토헤럴드
시대의 아이콘 마릴린 먼로 재해석, 제네시스 문화 마케팅 뉴욕에서 흥행	오토헤럴드
테슬라 모델 3 'NCMㆍLFP' 배터리 잔존 성능 비교했더니 충격 결과	오토헤럴드
미국의 이란 전쟁에 따른 유가 재 급등과 글로벌 청정에너지·전기차 전환 가속화	글로벌오토뉴스
폭스바겐, 중국 시장 공략 위한 신형 전기차 3종 공개	글로벌오토뉴스
미국 캘리포니아주, 6억 달러 규모 즉시 환급 전기차 인센티브 도입	글로벌오토뉴스
태양광 전기차 스타트업 압테라, 서비스망 구축 및 EPA 인증 획득으로 양산 출시에 박차	글로벌오토뉴스
중국 하이난, 2030년 내연기관차 판매 금지 확정…중국 최초	글로벌오토뉴스
포르쉐, 7월 말 내연기관 마칸 생산 종료	글로벌오토뉴스
캡콤, '몬스터 헌터 와일즈' 본편 정가 인하 예고	게임동아
[취재] 라이엇, LOL 클래식 통해 “낭만의 시대를 다시 구현할 것”	게임동아
[취재] 라이엇, LOL을 더 자유롭고 풍성하게 만드는 것이 “본질로의 회귀”	게임동아
[취재] 라이엇의 매튜 릉 해리슨 “LOL의 본질로 돌아가는 업데이트 할 것”	게임동아
"낭만의 귀환!" ‘LCK 레전드 매치’, 치지직 롤파크서 개최 (1)	게임동아
유럽연합 관세 폭탄의 나비효과…서구 완성차는 유럽 리쇼어링, 중국계는 PHEV 우회·현지 생산	글로벌오토뉴스
중국 초고급차 홍치, 중국시장에서 롤스로이스 추월	글로벌오토뉴스
대구 삼성라이온즈파크에서 펼쳐지는 한국타이어의 독특한 안전 캠페인	글로벌오토뉴스
개최 20주년 맞이한 2026 대학생 자작자동차대회 바하 부문 군산서 개막	글로벌오토뉴스
여성 고객 겨냥한 올인원 케어 패키지 그레칼레 돈나 캠페인 출시	글로벌오토뉴스
BMW 코리아 미래재단 영 이노베이터 드림 프로젝트 하반기 공모 개최	글로벌오토뉴스
지커 공식 딜러 아이언EV 신세계 센텀시티서 '지커 7X' 팝업 스토어 개최	글로벌오토뉴스
JLR 코리아 영국 윔블던 파트너십 기념 서울서 럭셔리 관람 이벤트 성황	글로벌오토뉴스
제네시스, 마릴린 먼로 탄생 100주년 특별전 ‘매니페스팅 마릴린’ 뉴욕서 호평… 9월까지 연장	글로벌오토뉴스
피렐리, 가상 센서 스타트업 라이드센스 지분 인수하며 사이버 타이어 고도화 추진	글로벌오토뉴스
현대차 기아 제네시스 여름 특별 무상점검 서비스 실시 (1)	글로벌오토뉴스
보스턴다이나믹스 아틀라스 FIFA 월드컵 하프타임 퍼포먼스 개발 과정 공개	글로벌오토뉴스
현대차 친환경 사회공헌 러닝 캠페인 포레스트런 2026 참가자 모집	글로벌오토뉴스
포르쉐코리아 국내 최대 팬 페스티벌 포르쉐 바이브 서울 개최	글로벌오토뉴스
기아 카카오모빌리티 자율주행 서비스 전용 PBV 개발 협력	글로벌오토뉴스
현대 N 페스티벌 3라운드 인제스피디움서 성황리 폐막	글로벌오토뉴스
캘리포니아 전기차 즉시 보조금 제도가 테슬라 저격수가 된 이유	글로벌오토뉴스
현대차그룹, 보스턴다이내믹스 지분 100% 확보 추진... 피지컬 AI 가속화	글로벌오토뉴스
현대로템 피지컬 AI 기술 적용한 철도차량용 ADAS 기술 고도화 완료	글로벌오토뉴스
현대차 태국법인 현지 조립 전기차 호주 수출 공식화하며 생산 가동률 극대화	글로벌오토뉴스
AI뉴스 GPT5.6, GPT‑Live, Work, Grok 4.5, Muse Spark 1.1, LingbotWorld2, Google 커스텀 URL 등 동영상 있음	조코딩 JoCoding
에이서 노트북 사고 여름휴가 떠난다…드라이백·비치타월 증정	뉴스탭
‘반디 감성’ 담은 조립 PC 나온다…HYTE Y70 한정판 판매	뉴스탭
야마하 드럼 사면 세계적 드러머 레슨이 무료…드루메오 90일 구독권 제공	뉴스탭
여름철 반복되는 턱 주변 염증, 매일 쓰는 전기면도기가 원인?	뉴스탭
성수동서 1년간 9만6000잔 팔렸다…삿포로 생맥주의 새로운 실험	뉴스탭
한국인 3명 중 1명 ‘영양 불균형’…제스프리가 키위 한 알을 제안한 이유 (2)	뉴스탭
엔비디아·세가 30년 동행…‘버추어 파이터 크로스로드’ RTX 스파크 지원	뉴스탭
워터밤에서 시선 사로잡는 법…올여름 페스티벌 룩 핵심은 ‘플라워’ (1)	뉴스탭
[순위분석] 돌아온 ‘연어게임’, 마비노기 올해 첫 TOP 50	게임메카
[오늘의 스팀] 암전 속 교전, 타르코프 초고난도 이벤트 관심	게임메카
최후의 1인 긴장감 구현한 '배그' 실물 TCG 나온다	게임메카
포켓몬+마피아? 보드게임 신작 ‘너 혹시 로켓단?’ 공개	게임메카
데드 스페이스의 아버지, 글렌 스코필드 은퇴 선언 (1)	게임메카
챔피언스행 가린다, VCT 퍼시픽 스테이지 2 개막 예고	게임메카
원로 배우 스티브 부세미, 파 크라이 TV 시리즈 캐스팅 (2)	게임메카
피파가 선택한 '눈' \| 삼성 엘지도 긴장하는 이 회사 동영상 있음	다나와
전문가 생각은 전혀 다른데... 10명 중 9명 "도로는 안전하다" 인식 (1)	오토헤럴드
"손 놓아도 된다"는 착각, 도로 위 시한폭탄을 키운다	글로벌오토뉴스
‘도심선 전기차, 고속선 하이브리드’ 주행 상황 맞춰 답 찾는 BYD DM-i	글로벌오토뉴스
[오늘의 스팀] 삼국지 장수가 본인을 숨김, 신작 ‘블라인드삼국’	게임메카
역대 최고치, 스팀 올해 상반기 총 판매액 약 16조 원	게임메카
낭만의 시대로 떠나자, 롤 클래식 LCK 레전드 매치 예고	게임메카
넥슨재단·슈퍼셀·스마게 등 참여, 2026 유스 e스포츠 열린다	게임메카
LG·삼성·로보락 뭐가 좋을까? 2026 플래그십 로봇청소기 비교 (3)	다나와
[포토] 국립중앙도서관 개최 '단종 한국 게임, 다시 켜다' (1)	게임메카
[오늘의 스팀] 돌아온 전성기, 팰월드 동접 85만 돌파	게임메카
[롤짤] 한화생명 "MSI 개최국은 우승 못 한다고? 비켜" (1)	게임메카
숨바꼭질 게임 '멧챠 카멜레온', 신규 공식 맵 '이집트' 등장	게임메카
美·中 BCI 경쟁 두 갈래… 미국은 뇌 이식, 중국은 웨어러블	AI matters
AI 군사 시스템 기업 헬싱, 2조 7천억원 유치… 유럽 최대 방산 AI 투자	AI matters
EU 집행위, ‘텍스트·데이터 마이닝 옵트아웃 등록부’ 타당성 연구 발표	AI matters
AI 반도체 일제 매도…SK하이닉스 미국 상장이 부른 ‘수입된 변동성’ (1)	AI matters
딥시크 API 7월 24일 마감 경고…미스트랄은 ‘수학 증명’ 모델 공개	AI matters
중국, 해외 AI 접근 제한 검토…‘의인화 규제’는 이번 주 시행	AI matters
메타, 출시 72시간 만에 첫 이미지 AI ‘뮤즈 이미지’ 전격 철회	AI matters
앤트로픽, 몬조 공동창업자 톰 블롬필드 ‘컴퓨트팀’에 영입	AI matters
애플의 오픈AI ‘영업비밀 절도’ 소송에 머스크·올트먼 또 충돌	AI matters
AI 챗봇, 섭식장애에 위험한 식단 조언…”챗GPT를 의사보다 신뢰” 경고	AI matters
드롭박스, 클로드에 파일·업무 맥락 연결…챗GPT·제미나이 스파크도 지원	AI matters
미국 데이터센터 반대 확산… AI 부가 주택시장까지 흔든다	AI matters
골드만삭스, 고객에 중국 AI 모델 콕 집어 추천	AI matters

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

"10대는 이기적, 노인은 친절?" AI 모델 10개의 나이·성별·인종 편견 분석

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

"10대는 이기적, 노인은 친절?" AI 모델 10개의 나이·성별·인종 편견 분석

공유하기

공감/비공감