모든 차별이 나쁜가?... AI 공정성에 대한 스탠포드 연구진의 새로운 제안 : 다나와 DPG는 내맘을 디피지

Fairness through Difference Awareness: Measuring Desired Group Discrimination in LLMs

스탠포드 대학교 연구진이 발표한 논문 "차이를 인식하는 공정성: LLM에서 집단 간 차별의 측정"에 따르면, 현재 AI 업계에서 통용되는 "차이를 구분하지 않는" 공정성 접근법이 오히려 AI의 판단력을 저하시킬 수 있다는 연구 결과가 나왔다. 연구진은 AI 공정성을 평가하는 새로운 기준을 제시하며, 기존 편향 제거 방식의 문제점을 지적하고 AI 모델이 차별을 인식하면서도 적절한 맥락을 반영하는 방법을 모색했다.

"인종과 성별을 구분하지 말라"는 AI 공정성의 맹점

기존 AI 공정성 평가 방식은 대부분 모든 사회 집단을 동일하게 대우하는 것을 목표로 삼고 있다. 연구진이 2024년 7월 30일 이전에 발표된 AI 공정성 벤치마크 37개를 분석한 결과, 32개가 차이를 구분하지 않는 접근법을 채택하고 있음을 확인했다.

대표적인 예로, HELM은 "언어 선택의 체계적 비대칭성"을 편향으로 간주했다. BOLD는 "특정 집단이 다른 집단보다 부정적인 감정과 자주 연관되는 현상"을 편향으로 보았다. DiscrimEval은 "인구통계학적 속성에 따른 긍정적 결정 확률의 차이"를 공정하지 않은 것으로 규정했다.

연구진은 이러한 차별 철폐 방식이 모든 차이를 부정하는 방향으로 나아가면서 AI가 사회적 현실을 반영하지 못하게 만들 수 있다고 경고했다. 예를 들어, AI가 남성과 여성의 신체적 차이를 무시한 채 "군대 체력 기준은 동일해야 한다"고 답변하면 이는 현실과 맞지 않으며, 오히려 불공정한 결과를 초래할 수 있다.

2024년 12월 기준, 법적으로 허용되는 차별의 예시

연구진은 일부 차별이 법적으로나 사회적으로 필요할 수 있다고 지적하며, 이를 AI 모델이 제대로 인식해야 한다고 강조했다. 논문에서는 여러 법적 사례를 제시하며, AI가 차별을 완전히 배제하는 것이 오히려 부작용을 초래할 수 있음을 설명했다.

예를 들면, 미국에서는 징병이 남성에게만 적용되며, 이는 법적으로 허용된 차별이다. 특정 국가 출신자의 비자 신청이 거부되는 사례처럼, 정부 기관이 국가 안보를 위해 특정한 차별을 적용할 수 있다. 종교 단체가 같은 종교를 가진 지도자를 우선적으로 채용하는 것은 법적으로 보호된다. 의료 분야에서도 인종별 질병 발병률이 다를 수 있기 때문에, 차이를 인식하지 않는 AI 모델이 오히려 건강 불평등을 초래할 수 있다.

현재 AI는 이러한 사회적·법적 차이를 무시하고, 모든 경우에 대해 "평등"을 유지하려는 경향이 있다. 그러나 이는 현실과 맞지 않는 결론을 도출하게 만들며, 오히려 공정성을 저해할 수 있다.

8개 벤치마크, 16,000개 질문으로 검증한 새로운 평가 방식

연구진은 AI 공정성을 보다 정교하게 평가하기 위해 8개의 벤치마크, 총 16,000개의 질문을 개발했다. 이 벤치마크는 크게 서술적 평가(D1-D4)와 규범적 평가(N1-N4)로 구성된다. 서술적 평가에는 특정 직업에서 특정 종교인이 선호되는 것이 법적으로 허용되는지를 묻는 법적 차별 인식 평가와, 특정 국가에서 특정 종교인이 박해를 받을 가능성이 높은지를 평가하는 망명 신청자의 차별 여부 평가가 포함됐다.

규범적 평가에서는 편향적 발언의 상대적 유해성을 비교하거나, 특정 직업군에서 소수 인종이 부족한 경우 이를 개선해야 하는지를 판단하는 방식으로 구성됐다. 연구진은 이를 통해 AI가 단순히 "차별을 없애야 한다"는 기존 평가 방식에서 벗어나, 어떤 차별이 필요하며, 어떤 차별이 부적절한지를 구분하는 능력을 테스트할 수 있도록 했다.

AI 모델의 능력 향상이 공정성 향상으로 이어지지 않는 현상

연구진은 Llama, Mistral, Gemma, GPT-4, Claude 등 5개 모델 계열의 10개 모델을 대상으로 실험을 진행했다. 실험 결과, 기존의 AI 공정성 벤치마크에서 95~100%의 높은 점수를 받은 Gemma-2 9b와 GPT-4o도 새로운 평가 방식에서는 75% 미만의 성과를 보였다.

특히, 모델의 일반적인 성능(MMLU 점수 기준)이 높아질수록 맥락 인식 능력(CtxtAware)은 향상되었으나, 차이 인식 능력(DiffAware)은 개선되지 않았다는 점이 확인되었다. 이는 AI 모델의 성능 향상이 공정성 향상으로 직결되지 않음을 보여준다.

편향성 제거가 오히려 성능을 저하시키는 현상

연구진은 기존 "도덕적 자기 교정" 방식이 AI의 차별 인식 능력을 저하시킬 수 있음을 발견했다. 예를 들어, 특정 직업에서 여성의 과소대표성을 정확히 인식하던 모델이 편향 제거 후에는 "남성과 여성 모두 과소대표되지 않았다"라고 잘못된 답변을 하는 경우가 발생했다. 즉, 편향을 없애려는 과정에서 오히려 중요한 현실적 차이를 무시하게 되어 잘못된 판단을 내리는 문제가 발생하는 것이다.

RAG와 Chain-of-thought: 차이 인식 AI를 위한 해결책

연구진은 AI가 보다 정교한 판단을 내리도록 돕기 위해, 검색 증강 생성(RAG, Retrieval-Augmented Generation)과 사고 연쇄 방식(Chain-of-Thought, CoT)을 활용하는 방식을 제안했다. 예를 들어, 터키어의 성중립적 표현 "o bir doktor"를 영어로 번역할 때, "he is a doctor", "she is a doctor", "they are a doctor" 등 다양한 선택지를 제공하는 방식이 AI의 차별적 오류를 줄일 수 있다.

이번 연구는 AI가 단순히 차별을 배제하는 것이 아니라, 사회적 맥락에 따라 차이를 인식하는 것이 공정성을 향상시킬 수 있음을 입증했다. 기존의 "차별 없는 공정성"에서 벗어나, AI가 맥락에 맞는 차별을 이해하고 적용하는 방향으로 발전해야 한다는 것이 연구진의 핵심 주장이다.

해당 기사에 인용된 논문 원문은 링크에서 확인 가능하다.

기사는 클로드 3.5 Sonnet과 챗GPT를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

여름 식단도 ‘성분 확인’ 시대…식품업계, 함량·저당 제품 경쟁	뉴스탭
윈저글로벌, 대학생 서포터즈 ‘위너스 크루’로 개편…젊은 위스키 소비자 접점 확대	뉴스탭
파파존스, ‘토이 스토리 5’ 개봉 앞두고 성수동에 피자 플래닛 연다	뉴스탭
정품 등록하면 3년 무상 A/S…인텔 CPU 여름 프로모션 실시	뉴스탭
다크플래쉬, COMPUTEX 2026서 ‘통합 하드웨어 브랜드’ 비전 공개	뉴스탭
“팬 각도를 직접 조절한다”... Formula V Line, 컴퓨텍스서 Air Power G10 공개 예고	뉴스탭
때 이른 무더위에 에어컨 수요 급증…오텍캐리어 ‘디오퍼스+’ 판매 187% 증가	뉴스탭
마이크로닉스, COMPUTEX 2026서 3000W 파워·게이밍 AIO 공개	뉴스탭
외식비 부담에 집밥·홈카페 확산…주방가전이 바꾸는 ‘멀티 홈라이프’	뉴스탭
마이크로닉스, 플레이엑스포서 인디게임 부스 후원…게이머 접점 확대	뉴스탭
성능 넘어 취향까지…‘나만의 IT 셋업’ 완성하는 맞춤형 기기 3선	뉴스탭
씰리침대, 현대백화점 천호점서 ‘슈퍼 프라이스’ 행사 진행	뉴스탭
중국으로 진출한 ‘카오스 제로 나이트메어’, 앱스토어 무료 1위	게임동아
L&K ‘붉은보석’, 한국 서비스 23주년 기념 이벤트 실시	게임동아
넷마블 '세븐나이츠 리버스'에 각성과 첫 각성 영웅 '실베스타' 등장	게임동아
AI 게임 제작 플랫폼에서 프롬프트 한 줄로 게임이 뚝딱	게임동아
넷마블 '킹 오브 파이터 AFK'에 신규 파이터 '나코루루' 등장	게임동아
스퀘어에닉스 대표 IP ‘드퀘’ 9700만장·‘파판’ 2억900만장... 누적 판매량 공개	게임동아
스팀덱 OLED 가격 인상... “반도체 공급난 등으로 40% 이상 상승” (1)	게임동아
슈퍼캣 ‘돌 키우기 온라인’, 2.9.0 업데이트… ‘쇼미더스톤 핀볼’ 이벤트 실시	게임동아
온라인삼국지2 ‘밸런스 환장 대파티’ 업데이트 실시	게임동아
서든어택, 신규 생존전 모드 ‘로데오 솔로’ 추가	게임동아
크래프톤 배틀그라운드 모바일, 마운틴듀와 2026 공식 파트너십	게임동아
마이크로소프트, 액티비전 블리자드 인수 소송 2억 5,000만 달러에 합의	게임동아
김택성·이민희, 래디컬 컵 코리아 2라운드 극적 우승	글로벌오토뉴스
HTWO 광저우, 중국 광저우시 수소분야 산업체인 선도기업 선정	글로벌오토뉴스
한성자동차, 메르세데스-벤츠 코리아 ‘2025 딜러 어워드’ 대거 수상	글로벌오토뉴스
KAIA, 보호무역과 중국 공세 속 K-모빌리티 생태계 사수방안 논의	글로벌오토뉴스
현대모비스, 오픈소스 도입으로 SDV 표준 플랫폼 선점 나선다	글로벌오토뉴스
마세라티 코리아, 20대 한정 ‘그레칼레 폴고레’ 맞춤형 사전 예약 돌입	글로벌오토뉴스
브리지스톤 코리아, 소형트럭용 타이어 ‘6개월 무상교환’ 보증 프로그램 전개	글로벌오토뉴스
KGM, 차량 판매·정비·부품 한곳에 모은 ‘3S 복합 대리점’ 개소	글로벌오토뉴스
페라리 대표단, 교황 레오 14세 예방…‘페라리 루체’ 스티어링 휠 헌정	글로벌오토뉴스
BMW 코리아, 고객 맞춤형 문화 공간 ‘BMW 엑설런스 라운지 2026’ 성료	글로벌오토뉴스
한국앤컴퍼니, 임직원 참여 정기 봉사 ‘볼런티어 투게더 데이’ 전개	글로벌오토뉴스
신규 캐릭터 3종 출격, 포트리스3 블루 PC·모바일 출시	게임메카
해외 스팀 덱 가격 43~46% 인상, 국내 적용도?	게임메카
페라리 경영진, 교황 레오 14세 예방…‘페라리 루체’ 스티어링 휠 헌정	오토헤럴드
마세라티, 럭셔리 패키지 장착한 20대 한정 ‘그레칼레 폴고레’ 사전 예약	오토헤럴드
“GPT-5.5-사이버로 AI 보안 구축” 대한민국 정부ㆍ기관과 손잡은 오픈AI	IT동아
위쳐 3 신규 확장팩 '송즈 오브 더 패스트' 깜짝 발표	게임메카
[순위분석] 아이온2 이어, 아이온도 리메이크 달고 날았다	게임메카
아이피타임 BE19000QCA 유무선공유기 [써보니] 플래그십의 기준 상항평준화!	위클리포스트
‘블루 아카’, 서비스 4.5주년 기념 업데이트 진행.. "신규 캐릭터 3종 등장"	게임동아
CDPR, '더 위쳐 3' 11년 만에 세 번째 확장팩 '송즈 오브 더 패스트' 2027년 출시	게임동아
롬', '에피소드Ⅴ : 다크 렐름' 사전예약 진행	게임동아
넷마블 '레이븐2', 특화 서버 'ZERO' 오픈	게임동아
PS, 'Days of Play 2026' 프로모션 진행 "특별 할인 선보인다"	게임동아
히트2’, 신규 최상위 던전 ‘태초의 숲’ 업데이트	게임동아
차보다 집이 먼저, '포르자 호라이즌 6' 초보자를 위한 게임 팁	게임동아
"전쟁에 멈춘 공장" 토요타 감산이 보여준 자동차 산업의 불안한 현실	오토헤럴드
BYD, 글로벌 시장 겨냥 첫 PHEV 공개 '1회 충전·주유 기준 1000km'	오토헤럴드
기아, 완성도 높은 전기 SUV 'EV3' 독일 전문지 비교평가 ‘종합 1위’	오토헤럴드
한국타이어, 호주 신규 내구 레이스 ‘APCES’에 컨트롤 타이어 독점 공급	글로벌오토뉴스
현대모비스, 자회사형 장애인 표준사업장 ‘모아빛’ 본격 출범	글로벌오토뉴스
메르세데스-벤츠 코리아, 여름철 안전 운행 위한 ‘2026 세이프티 케어 캠페인’ 진행	글로벌오토뉴스
GM, ‘2025 올해의 우수 협력사’ 선정…국내 기업 20개사 수상	글로벌오토뉴스
414. 중국화된 자동차로 관세장벽과 프렌차이즈법의 미국시장도 뚫는다.	글로벌오토뉴스
유럽연합 4월 전기차 등록 37.7% 증가, 시장 점유율 19.7%	글로벌오토뉴스
중국 광저우 그룹, 럭키 모터와 협력 파키스탄 시장 전격 진출	글로벌오토뉴스
BMW 중국 진출 20주년 맞아 문화유산 보존 프로그램에 AI·디지털 기술 전격 도입	글로벌오토뉴스
중국 샤오미오토, 1분기 영업손실 31억 위안	글로벌오토뉴스
스텔란티스와 JLR 북미 시장 겨냥 제품 및 기술 개발 협력 위한 MOU 체결	글로벌오토뉴스
히어 테크놀로지스 공간 추론 인공지능 솔루션 히어 위치 추론 공개	글로벌오토뉴스
시트로엥 전설적 명차 2CV 전기차로 부활 파리 모터쇼서 세부 계획 공개	글로벌오토뉴스
웨이모, 폭우·고속도로 공사 구간서 기술적 한계… 미국 주요 도시 운행 일시 중단	글로벌오토뉴스
테슬라 안전성 검증 문제로 무감독 로보택시 20대로 감소	글로벌오토뉴스
바이두 아폴로 고, 우한 대규모 마비 사태로 로보택시 확장 제동	글로벌오토뉴스
정원엔시스 'HP HyperX OMEN 15' 고객 대상 '007 First Light' 번들 프로모션	다나와
OWC, 컴퓨텍스 2026에서 Thunderbolt 5 AI 및 스토리지 허브 ‘OWC Stack AI’ 발표	다나와
마이크로닉스, 2026 플레이엑스포 ‘오! 로봇’ 부스 후원 성료	다나와
OWC, 컴퓨텍스2026서 Thunderbolt 5 기반 ‘로컬 AI 허브’ 공개 (1)	뉴스탭
마이크로닉스, 플레이엑스포서 KEL 이터널 리턴 오프라인 일정 성료	뉴스탭
캐논 풀프레임 유저들이 포착한 ‘한국의 아름다움’ 한자리에 (1)	뉴스탭
AI 시대 K-콘텐츠 새 화두 ‘콘텐츠 엔지니어링’ 논의 열린다 (1)	뉴스탭
오픈AI “한국에 AI 사이버 방어 역량 확대”…‘코리아 사이버 액션 플랜’ 발표	뉴스탭
“다리가 떠 불편했는데…” 신현준 딸이 말한 툴레 카시트 ‘팜’의 차이	뉴스탭
시그니파이 식물생육 LED, LG CNS 수직농장에 적용…에너지 효율 25% 향상 (1)	뉴스탭
엔씨 '리니지 클래식', '잔혹한 눈의 마을, 오렌' 사전예약 진행	게임동아
카카오게임즈 ‘오딘’, 신규 길드 콘텐츠 업데이트	게임동아
하이브로 ‘드래곤빌리지3’, 글로벌 정식 출시… 12년 만의 넘버링 신작	게임동아
친구와 함께 하는 유적 탐사! 협동 파티 호러 게임 '초자연 작전팀' 출시	게임동아
아예 비싸거나, 낮은 가격으로 박리다매. 게임 가격 중간이 없어진다 (1)	게임동아
넷마블 'RF 온라인 넥스트', 신규 클래스 '데몰리션' 등장	게임동아
스마일게이트 ‘카제나’, 시즌3 신규 스토리 ‘한 소녀의 악몽’ 업데이트	게임동아
아스트라에 오라티오, ‘고양이 주임’과 ‘기모노 청장’ 공개	게임메카
넷마블 '왕좌의 게임: 킹스로드', 28일 오후 7시 개발자 라이브 방송	게임동아
中 게임사 ‘유주게임즈’ 창업자 독살범, 사형 집행	게임동아
14년째 개발 중인 ‘스타 시티즌’, 펀딩액 1조 3천억 돌파	게임동아
비피엠지, 게임 IP 기반 사업 강화..'포트리스와 에오스' 웹3화 추진	게임동아
펄어비스 검은사막, ‘왜곡의 흔적’ 인장 3차 이벤트 개최	게임동아
‘어린이들의 위대한 응원’ 현대차, 월드컵 대표팀 버스 디자인 공개	오토헤럴드
'브랜드 첫 전기차에 쏟아진 혹평' 페라리, 루체 공개 후 주가 급락 (1)	오토헤럴드
중국계 꼬리표 뗀 볼보, 美 ‘커넥티드카 규제’ 예외 승인에 숨통	오토헤럴드
테슬라, 인증 라벨 누락 '무선 업데이트'로 안되는 이례적 리콜	오토헤럴드
현대차 '아이오닉 드론 스테이션' 산불 피해지역 생태계 복원 지원 (1)	오토헤럴드
GM 글로벌 공급망 흔든 K-부품 ‘올해의 우수 협력사' 국내 협력사 20곳 선정	오토헤럴드
북미 무역 질서 재편 조짐, 관세 유지 방침에 '완성차 업계 초긴장'	오토헤럴드
르노·폭스바겐 경쟁판에 중국산 EV 역투입, 스텔란티스 선택은 '보야'	오토헤럴드
소비자 손으로 만드는 고성능 M 에디션, BMW 코리아 ‘2026 나만의 에디션’ 투표 개시	글로벌오토뉴스

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

모든 차별이 나쁜가?... AI 공정성에 대한 스탠포드 연구진의 새로운 제안

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

모든 차별이 나쁜가?... AI 공정성에 대한 스탠포드 연구진의 새로운 제안

공유하기

공감/비공감