로그인하세요
알림
설정
레프트패널 닫기
관심
최근본
마이페이지
출석체크
카테고리
    서비스 바로가기
    • 자동차
    • 인기 서비스조립PC
    • PC견적
    • PC26
    • 신규 서비스LIVE쇼핑
    • 커뮤니티
    • 이벤트
    • CM추천/문의
    • 오늘의 특가
    앱 서비스
    • 자동차
    • PC견적
    • 장터
    인기 쇼핑몰
    • 지마켓
    • 옥션
    • 11번가
    • 롯데아이몰
    • 쿠팡
    • 롯데닷컴(롯데온)
    • 신세계몰
    • 현대Hmall
    • CJ 온스타일
    • GS샵
    • 하이마트
    • 엘롯데
    • 이마트몰
    • 홈플러스
    • NS몰
    • SK스토아
    • KT알파 쇼핑
    • 전자랜드
    • 무신사
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) (우) 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    사용법 보기
    MY쇼핑이란? 자주 쓰는 쇼핑몰을 연결하면 쇼핑몰 주문내역을 한 번에 확인할 수 있습니다. 쇼핑몰 계정은 고객님의 핸드폰에만 저장되어 안전합니다.
    편리한 구매내역 확인. 다양한 쇼핑몰의 주문내역을 한 곳에서 확인해보세요.
    가격비교와 최저가 쇼핑을 한 번에. 자주 구매하는 상품은 가격비교를 통해 저렴하게 구매하세요.
    보안은 필수! 쉽고 편한 가치 쇼핑. 쇼핑몰 계정은 고객님의 핸드폰에만 암호화 저장되어 안전합니다. 쇼핑몰 연결
    다나와 홈

    커뮤니티 DPG

    일반뉴스

    • 게시판
    • 상품포럼
    • 뉴스
    • 동영상
    • 커뮤니티 공지사항
      소비자사용기
    • 특가몰
      자유게시판
    • 이달의 이벤트
      유머게시판
    • 당첨자발표게시판
      댕냥이게시판
    • 포인트 마켓
      Q&A게시판
    • 다나와 래플
      상품의견
    • 모두의 경매
      체험단
    • 오늘도 출석체크
      엄근진게시판
    • 입소문쇼핑
      쇼핑몰후기
    • 메인가자
      A/S후기
    • 당첨후기
    • 컴퓨터
      AI
    • 푸드
      취미
    • 최신뉴스
      일반뉴스
    • 기획뉴스
      신상품뉴스
    • 쇼핑뉴스
      테크팁
    • 다나와리포터
      구매가이드
    • 전문가리뷰
      인기순위가이드
    • 벤치마크
      차트뉴스
    • 가격동향
    • 고나고
      공구왕황부장
    • 노써치
      도레
    • 딴트공 말방구 실험실
      라이브렉스
    • 레고매니아
      맛상무
    • 모터피디
      무적풍화륜
    • 민티저
      보드나라
    • 뻘짓연구소
      여행매거진 트래비TV
    • 오토기어
      조코딩 JoCoding
    • 인프제 INFJ
      주연 ZUYONI
    • 진블로그
      집마 홀릭TV
    • 톡써니
      포마: 탈 것을 리뷰하는 남자
    • 쿨엔조이
      훅간다TV
    • AI 매터스
      Allthatboots TV
    • DmonkTV
      Hakbong Kwon
    • Motorgraph
      PC SNAP
    • Producer dk
      THE EDIT
    • UnderKG
      다나와 공식채널
    • 답나와
      리뷰나와
    • 샵다나와 조립갤러리
      직장인 다나왕
    >
    이전 글
    다음 글
    AI matters

    "누군가의 자유 침해하면 안 돼" 이해 못 하는 AI… 2,500개 상황서 도덕 테스트한 결과

    2025.06.05. 14:03:31
    읽음392

    MORALISE: A Structured Benchmark for Moral Alignment in Visual Language Models

    2,481개 실제 상황으로 테스트한 13가지 도덕 영역, AI의 숨겨진 편향 드러나

    일리노이 대학교 어바나-샴페인과 아마존(Amazon), 피델리티 인베스트먼츠(Fidelity Investments) 연구진이 공동 개발한 모럴라이즈(MORALISE) 벤치마크가 현재 최첨단 비전-언어 모델(VLM)들의 도덕적 판단 능력에 상당한 문제가 있음을 밝혀냈다. 이 연구는 터리엘의 도메인 이론(Turiel's Domain Theory)에 기반해 개인적, 대인 관계적, 사회적 도덕 영역을 포괄하는 13개 도덕 주제로 구성된 체계적인 분류 체계를 제시했다. 연구진은 2,481개의 전문가 검증 실제 이미지-텍스트 쌍을 수집해 각 샘플에 도덕적 위반이 이미지에서 발생하는지 텍스트에서 발생하는지를 구분하는 모달리티 주석과 위반된 특정 도덕 주제를 식별하는 주제 주석을 부여했다.

    기존의 도덕성 평가 연구들이 대부분 텍스트 기반 대화형 언어 모델(LLM)에만 집중했던 반면, 이번 연구는 이미지와 텍스트를 동시에 처리하는 비전-언어 모델의 도덕적 추론 능력을 종합적으로 평가한 최초의 대규모 연구다. 특히 기존 벤치마크들이 AI가 생성한 합성 이미지에 의존했던 것과 달리, 모럴라이즈는 핀터레스트(Pinterest), 레딧(Reddit), 구글 검색(Google Search) 등에서 수집한 실제 이미지만을 활용해 현실적인 도덕적 상황을 반영했다.


    GPT-4o 88% vs 66%, 세밀한 도덕 추론에서 22%p 급락한 성능

    GPT-4o, GPT-4o-mini를 포함한 오픈AI(OpenAI)의 폐쇄형 모델부터 Qwen2.5-VL, InternVL3, Gemma3, LLaVA 등 19개 주요 오픈소스 및 상용 VLM에 대한 포괄적 평가를 실시한 결과, 모든 모델이 도덕적 판단 작업에서 상당한 어려움을 겪는 것으로 나타났다. 특히 단순한 이진 도덕 판단과 비교해 특정 도덕 규범을 식별하는 세밀한 도덕 추론 작업에서 성능이 현저히 떨어졌다. 예를 들어 폐쇄형/오픈소스 모델들이 도덕 판단에서 평균 88.28/83.55의 정확도를 보인 반면, 규범 식별에서는 66.60/42.63의 적중률에 그쳤다.

    연구진이 설계한 평가 과제는 도덕적 판단(Moral Judgment)과 도덕 규범 귀속(Moral Norm Attribution) 두 가지로 구성된다. 도덕적 판단 과제에서는 주어진 시나리오가 도덕적으로 잘못된 것인지 단순히 판별하도록 했고, 도덕 규범 귀속 과제에서는 구체적으로 어떤 도덕 원칙이 위반되었는지 식별하도록 했다. 가장 우수한 성능을 보인 GPT-4o조차 존중(respect) 주제에서 42.32의 F1 점수에 그쳐 복잡한 도덕적 주제에서의 한계를 드러냈다.

    "사진만 보고 판단하세요" 텍스트 제거하자 AI 도덕 감각 급격히 저하

    연구 결과 모든 VLM이 시각적 단서만으로 도덕적 판단을 내리는 데 텍스트 기반 추론보다 현저히 어려움을 겪는 것으로 확인됐다. 텍스트 중심 위반에서는 일관되게 높은 정확도와 낮은 분산을 보인 반면, 이미지 중심 위반에서는 성능이 크게 저하됐다. 이는 현재 VLM들이 도덕적 추론에서 여전히 언어를 주요 정보원으로 우선시하며, 순수한 시각적 콘텐츠만으로는 도덕적 판단을 내리는 데 한계가 있음을 보여준다.

    이러한 모달리티별 성능 차이는 향후 VLM 개발에서 시각적 도덕 이해 능력 향상이 중요한 과제임을 시사한다. 실제 응용 환경에서는 텍스트 설명이 없는 이미지만으로도 도덕적 판단이 필요한 상황이 빈번하기 때문이다. 연구진은 이러한 시각적 도덕 추론 능력의 부족이 자율주행차의 윤리적 판단이나 의료 영상 분석 등에서 심각한 문제를 야기할 수 있다고 경고했다.


    '때리면 안 돼'는 알지만 '자유를 침해하면 안 돼'는 모르는 AI

    주제별 평가에서 모델들은 해(harm), 정의(justice), 진실성(integrity) 등 사회적 담론에서 널리 강조되는 도덕 규범에서 상대적으로 높은 정확도를 보였다. 반면 자유(liberty), 존중(respect), 상호성(reciprocity) 등 추상적이거나 미묘한 도덕 규범에서는 성능이 현저히 떨어졌다. 이는 사전 훈련 과정에서 자주 언급되는 도덕적 주제들이 더 잘 학습되는 반면, 덜 논의되는 주제들에 대해서는 추가적인 관심이 필요함을 시사한다.

    연구진의 분석에 따르면 모델 크기가 작은 것(5B 미만)에서 중간 규모(약 10B)로 확장하면 도덕적 판단 능력이 크게 향상되지만, 중간 규모를 넘어서면 성능 향상 효과가 정체된다. 이는 기본적인 텍스트와 이미지 이해 능력이 확보된 후에는 단순한 모델 확장만으로는 도덕적 일치성을 달성하기 어렵다는 것을 의미한다. 오히려 도덕적 정렬을 위한 특화된 훈련 목표가 필요하다는 결론에 이른다.

    FAQ

    Q: MORALISE 벤치마크가 기존 도덕 평가 도구와 다른 점은 무엇인가요?

    A: MORALISE는 AI가 생성한 이미지가 아닌 실제 이미지를 사용하며, 13개의 세분화된 도덕 주제를 다루고, 이미지와 텍스트 중 어느 모달리티에서 도덕적 위반이 발생하는지 구분할 수 있는 유일한 벤치마크입니다.

    Q: 현재 VLM들의 도덕적 판단 능력이 부족한 이유는 무엇인가요?

    A: 모델들이 사전 훈련에서 자주 접하는 해나 정의 같은 명시적 도덕 규범은 잘 학습하지만, 자유나 존중 같은 추상적 개념은 충분히 학습되지 않았고, 특히 시각적 정보만으로는 도덕적 추론을 수행하기 어려워합니다.

    Q: 이 연구 결과가 AI 안전성에 미치는 영향은 무엇인가요?

    A: 자율주행, 의료진단 등 도덕적으로 민감한 분야에서 VLM 활용이 증가하는 가운데, 이 연구는 현재 모델들의 도덕적 한계를 명확히 드러내어 더 안전하고 책임감 있는 AI 시스템 개발의 필요성을 제기합니다.


    해당 기사에 인용한 논문 원문은 링크에서 확인 가능하다.




    AI Matters 뉴스레터 구독하기
    태그
    자유 침해 AI 도덕 테스트
    안내 ?

    말 많은 뉴스

    • 1

      김치냉장고는 사실 아주 이상한 가전입니다

      댓글6
      김치냉장고는 사실 아주 이상한 가전입니다
    • 2

      [시승기] '연비 괴물' 혼다 CR-V 하이브리드, 도심에 최적화된 SUV

      댓글5
      [시승기] '연비 괴물' 혼다 CR-V 하이브리드, 도심에 최적화된 SUV
    • 3

      2026년 기준 99%가 모르는 갤럭시 필수 설정 5가지 I 아이폰 → 갤럭시 기변시 강력추천앱

      댓글3
      2026년 기준 99%가 모르는 갤럭시 필수 설정 5가지 I  아이폰 → 갤럭시 기변시 강력추천앱
    • 4

      ‘중국’을 넘어 프리미엄으로 향하다, 로보락 로봇청소기 [라인업을보자]

      댓글2
      ‘중국’을 넘어 프리미엄으로 향하다, 로보락 로봇청소기 [라인업을보자]
    • 5

      “닭을 통째로 고아냈다”…하림, 깊고 시원한 ‘닭칼국수’ 라면 출격

      댓글2
      “닭을 통째로 고아냈다”…하림, 깊고 시원한 ‘닭칼국수’ 라면 출격

    일반뉴스 최신 글

    이전 페이지 1/10 다음 페이지
    • 서린씨앤아이 'ARCTIC 정밀 스크루드라이버 세트' 재입고

      다나와 26.02.24.
      읽음 91 공감 9
    • [자동차와 法] 교통사고 관련 오해와 진실

      IT동아 26.02.24.
      읽음 65 공감 7
    • 테슬라 그록 AI, 목적지 도착 후 주차 방식까지 말로 지시한다

      글로벌오토뉴스 26.02.24.
      읽음 74 공감 7
    • 시동을 건다는 것

      글로벌오토뉴스 26.02.24.
      읽음 69 공감 7
    • [뉴스줌인] 답변만 하는 AI는 옛말… 갤럭시 S26에 스스로 일하는 'AI 에이전트' 추가?

      IT동아 26.02.24.
      읽음 79 공감 7
    • [월간자동차] 26년 1월, 국산 ‘기아 쏘렌토’·수입 ‘벤츠 E-클래스’ 1위 탈환

      IT동아 26.02.24.
      읽음 60 공감 7
    • '수요 제로 전기차' 람보르기니, 첫 순수 전기차 란차도르 양산 계획 철회

      오토헤럴드 26.02.24.
      읽음 67 공감 7
    • 현대차, LACMA 파트너십 2037년까지 연장...다각적 협업 예술 교감 확대

      오토헤럴드 26.02.24.
      읽음 60 공감 7
    • 폭스바겐그룹, 디자인 세대 교체 '안드레아스 민트' 신임 그룹 디자인 총괄

      오토헤럴드 26.02.24.
      읽음 56 공감 7
    • '독일 아우토반이 상징' 유럽이 빚는 제네시스 마그마의 고성능 전략

      오토헤럴드 26.02.24.
      읽음 58 공감 7
    • 폭스바겐그룹, 안드레아스 민트 신임 디자인 총괄 임명... 2026년 3월 취임

      글로벌오토뉴스 26.02.24.
      읽음 66 공감 7
    • 만트럭버스코리아 ‘MyMAN Korea’ 앱, 출시 7개월 만에 가입자 1,600명 돌파

      글로벌오토뉴스 26.02.24.
      읽음 73 공감 7
    • 메르세데스-벤츠 코리아, 26년식 ‘EQE 350+ SUV’ 출시

      글로벌오토뉴스 26.02.24.
      읽음 76 공감 7
    • 채비, 이동식 전기차 충전 위탁운영 사업자로 선정

      글로벌오토뉴스 26.02.24.
      읽음 74 공감 7
    • 캐딜락, ‘2026 더 뉴 에스컬레이드’ 국내 출시... ‘슈퍼크루즈’ 적용

      글로벌오토뉴스 26.02.24.
      읽음 72 공감 7
    • 로터스, 피아노 거장 ‘랑랑’ 글로벌 앰배서더 위촉

      글로벌오토뉴스 26.02.24.
      읽음 69 공감 1
    • 토요타코리아, 2026 슈퍼레이스 공식 후원... 7년 연속 파트너십 이어가

      글로벌오토뉴스 26.02.24.
      읽음 74 공감 1
    • 한자연, 미래차 부품업계 인력·기술 전환 지원.

      글로벌오토뉴스 26.02.24.
      읽음 67 공감 1
    • 애스턴마틴, 브라질에 첫 럭셔리 주거 단지 ‘세타이 레지던스’ 발표

      글로벌오토뉴스 26.02.24.
      읽음 66 공감 1
    • 애스턴마틴 THOR 팀, 2026 WEC LMGT3 라인업 확정

      글로벌오토뉴스 26.02.24.
      읽음 63 공감 1
    • 현대차, 美 LACMA와 파트너십 2037년까지 연장

      글로벌오토뉴스 26.02.24.
      읽음 75 공감 1
    • 호스 파워트레인, 100% 재생 휘발유 기반 차세대 하이브리드 공개

      글로벌오토뉴스 26.02.24.
      읽음 71 공감 1
    • 니오, 하루 배터리 교체 17만 건 돌파

      글로벌오토뉴스 26.02.24.
      읽음 75 공감 1
    • MG, 유럽•영국 누계 판매 100만 대 돌파... 중국 브랜드 최초

      글로벌오토뉴스 26.02.24.
      읽음 69 공감 1
    • 동남아시아 시장에서 일본차 위세 지속 하락

      글로벌오토뉴스 26.02.24.
      읽음 67 공감 1
    • 중국, 터치스크린 중심에 제동

      글로벌오토뉴스 26.02.24.
      읽음 80 공감 1
    • 메르세데스-벤츠 ‘베이비 G’ 플랫폼 전격 변경, 2027년 출시 예정

      글로벌오토뉴스 26.02.24.
      읽음 72 공감 1
    • 람보르기니, 첫 순수 전기차 ‘란자도르’ 생산 전격 취소

      글로벌오토뉴스 26.02.24.
      읽음 75 공감 1
    • 포드 머스탱 마하-E, 2026년형부터 ‘프렁크’ 유료화

      글로벌오토뉴스 26.02.24.
      읽음 75 공감 1
    • 폭스바겐 스카우트, 출시 지연설 ‘정면 돌파’... 2027년 생산 목표 고수

      글로벌오토뉴스 26.02.24.
      읽음 73 공감 1
    • 란잔테, 세계 최초 '레이저 광섬유' 후미등 탑재한 850마력 슈퍼카 95-59 공개

      글로벌오토뉴스 26.02.24.
      읽음 71 공감 1
    • 美 자동차 ‘빅3’, 전기차 투자로 500억 달러 증발

      글로벌오토뉴스 26.02.24.
      읽음 69 공감 1
    • 핀란드 '도넛 랩', 전고체 배터리 독립 테스트 성공

      글로벌오토뉴스 26.02.24.
      읽음 74 공감 1
    • 압도적 규모의 펫수집 RPG '스톤에이지 키우기' 미리보기

      게임동아 26.02.24.
      읽음 51 공감 1
    • 'Back to the Dawn ~브레이크 더 애니멀 프리즌~' 스위치 1,2 버전 패키지 예약 돌입

      게임동아 26.02.24.
      읽음 48
    • 스틸시리즈, ‘T1' 굿즈 증정 프로모션 진행

      게임동아 26.02.24.
      읽음 54 공감 1
    • 70년대 감성 '깃발 뺏기' 개임 ‘라스트 플래그’ 4월 14일 출시

      게임동아 26.02.24.
      읽음 52
    • 바이오하자드 레퀴엠 유출... 바하2 개발자, SNS에 ‘만 번 죽어 마땅’ 분노의 저주글 올려

      게임동아 26.02.24.
      읽음 68 공감 2 댓글 1
    • “17만 원 좀 넘나?” GTA 6, 온라인 판매점에 가격 정보 노출

      게임동아 26.02.24.
      읽음 55 공감 1
    • 첫 자취, 뭘 사야 할지 막막하다면…센스 있는 집들이 선물 리스트

      뉴스탭 26.02.24.
      읽음 50 공감 2
    • 스마트폰에 ‘착’ 붙이는 립앤치크…호미어, 맥세이프 뷰티 시대 열다

      뉴스탭 26.02.24.
      읽음 55 공감 1
    • “치킨치즈스틱·미트칠리감자 전국 상륙”…맘스터치, 사이드 메뉴로 매출 판 키운다

      뉴스탭 26.02.24.
      읽음 55 공감 3 댓글 1
    • 배한성 목소리, AI로 되살아난다…일레븐랩스·위츠, 음성 IP 실험 착수

      뉴스탭 26.02.24.
      읽음 59 공감 1
    • 만트럭 ‘MyMAN Korea’ 7개월 만에 1,600명 돌파…수입 상용차 첫 서비스 예약 앱 통했다

      뉴스탭 26.02.24.
      읽음 54 공감 1
    • “온도 아닌 기분을 읽는다”… 오텍캐리어, AI 에어컨 ‘디오퍼스+’로 냉방 공식 바꾼다

      뉴스탭 26.02.24.
      읽음 57 공감 1
    • 46만원 그래픽카드를 단 5만원에…조텍, RTX 5050 래플 이벤트 진행

      뉴스탭 26.02.24.
      읽음 73 공감 2
    • “프린터도 10km 무선 시대”… HP, 와이파이 헤일로로 기업 보안시장 공략

      뉴스탭 26.02.24.
      읽음 58 공감 1
    • KFC, 이번엔 ‘투움바’로 치밥 승부수…최현석 셰프와 손잡고 신메뉴 출격

      뉴스탭 26.02.24.
      읽음 54 공감 2
    • PC 조립·수리 필수템… ARCTIC 정밀 스크루드라이버 세트 국내 재입고

      뉴스탭 26.02.24.
      읽음 60 공감 2
    • 엔씨(NC) '아이온2', 신규 초월 공개 ∙∙∙ 론칭 100일 기념 이벤트 진행

      게임동아 26.02.24.
      읽음 51 공감 5
    • <3월 모바일 출석체크> 3월 출석하고 선물받기

    • 답 안 나올 땐 답나와를 찾아주세요.

    • [2.10~2.23] 주연테크 Q27C15 IPS QHD USB-C 100

    스폰서 PICK

    이전 페이지 1/3 다음 페이지
    • 엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스
    • 잘만 ALPHA II DS A36(블랙)

      잘만 ALPHA II DS A36(블랙)

      잘만
    • 앱코 G40 시그니처(블랙)

      앱코 G40 시그니처(블랙)

      앱코
    • darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash
    • AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD
    • 다크플래쉬
    • 잘만
    • AMD
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) / 우편번호: 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    뒤로
    새로고침 맨위로 이동
    안내

    유용하고 재미있는 정보인가요? 공감이 된다면 공감 버튼을,
    그렇지 않다면 비공감 버튼을
    눌러 주세요!
    공감이나 비공감을 선택 하는 경우
    다나와 포인트를 적립해 드립니다.
    ※ 공감 버튼의 총 선택 횟수는
    전체 공개입니다.
    비공감 버튼의 선택 여부는
    선택한 본인만 알 수 있습니다.

    포인트 안내
    목록
    공감 10
    비공감
    댓글
    공유

    공유받은 친구가 활동하면 포인트를!

    URL이 복사되었습니다.

    공유하기

    레이어 닫기

    지금 보는 페이지가 마음에 든다면
    공유하기를 통해 지인에게 소개해 주세요.

    • 카카오톡
    • 라인
    • 페이스북
    • X
    • 밴드
    https://dpg.danawa.com/mobile/news/view?boardSeq=60&listSeq=5824199 복사

    로그인 유저에게는 공유 활동에 따라
    다나와 포인트가 지급됩니다.

    자세히 >

    URL이 복사되었습니다.