로그인하세요
알림
설정
레프트패널 닫기
관심
최근본
마이페이지
출석체크
카테고리
    서비스 바로가기
    • 자동차
    • 인기 서비스조립PC
    • PC견적
    • PC26
    • 신규 서비스LIVE쇼핑
    • 커뮤니티
    • 이벤트
    • CM추천/문의
    • 오늘의 특가
    앱 서비스
    • 자동차
    • PC견적
    • 장터
    인기 쇼핑몰
    • 지마켓
    • 옥션
    • 11번가
    • 롯데아이몰
    • 쿠팡
    • 롯데닷컴(롯데온)
    • 신세계몰
    • 현대Hmall
    • CJ 온스타일
    • GS샵
    • 하이마트
    • 엘롯데
    • 이마트몰
    • 홈플러스
    • NS몰
    • SK스토아
    • KT알파 쇼핑
    • 전자랜드
    • 무신사
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) (우) 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    사용법 보기
    MY쇼핑이란? 자주 쓰는 쇼핑몰을 연결하면 쇼핑몰 주문내역을 한 번에 확인할 수 있습니다. 쇼핑몰 계정은 고객님의 핸드폰에만 저장되어 안전합니다.
    편리한 구매내역 확인. 다양한 쇼핑몰의 주문내역을 한 곳에서 확인해보세요.
    가격비교와 최저가 쇼핑을 한 번에. 자주 구매하는 상품은 가격비교를 통해 저렴하게 구매하세요.
    보안은 필수! 쉽고 편한 가치 쇼핑. 쇼핑몰 계정은 고객님의 핸드폰에만 암호화 저장되어 안전합니다. 쇼핑몰 연결
    다나와 홈

    커뮤니티 DPG

    일반뉴스

    • 게시판
    • 상품포럼
    • 뉴스
    • 동영상
    • 커뮤니티 공지사항
      소비자사용기
    • 특가몰
      자유게시판
    • 이달의 이벤트
      유머게시판
    • 당첨자발표게시판
      댕냥이게시판
    • 포인트 마켓
      Q&A게시판
    • 다나와 래플
      상품의견
    • 모두의 경매
      체험단
    • 오늘도 출석체크
      엄근진게시판
    • 입소문쇼핑
      쇼핑몰후기
    • 메인가자
      A/S후기
    • 당첨후기
    • 컴퓨터
      AI
    • 푸드
      취미
    • 최신뉴스
      일반뉴스
    • 기획뉴스
      신상품뉴스
    • 쇼핑뉴스
      테크팁
    • 다나와리포터
      구매가이드
    • 전문가리뷰
      인기순위가이드
    • 벤치마크
      차트뉴스
    • 가격동향
    • 고나고
      공구왕황부장
    • 노써치
      도레
    • 딴트공 말방구 실험실
      라이브렉스
    • 레고매니아
      맛상무
    • 모터피디
      무적풍화륜
    • 민티저
      보드나라
    • 뻘짓연구소
      여행매거진 트래비TV
    • 오토기어
      조코딩 JoCoding
    • 인프제 INFJ
      주연 ZUYONI
    • 진블로그
      집마 홀릭TV
    • 톡써니
      포마: 탈 것을 리뷰하는 남자
    • 쿨엔조이
      훅간다TV
    • AI 매터스
      Allthatboots TV
    • DmonkTV
      Hakbong Kwon
    • Motorgraph
      PC SNAP
    • Producer dk
      THE EDIT
    • UnderKG
      다나와 공식채널
    • 다나와 2TV
      노리다
    • 샵다나와 조립갤러리
    >
    이전 글
    다음 글
    AI matters

    마이크로소프트가 밝힌 AI 안전성의 현주소...인간의 판단이 더욱 중요해진다

    2025.01.15. 13:07:20
    읽음317

    Lessons from red teaming 100 generative AI products



    AI 레드팀이 발견한 8가지 핵심 교훈

    마이크로소프트 AI 레드팀(AIRT)이 100개 이상의 생성형 AI 제품을 테스트한 결과를 담은 보고서에 따르면, AI 시스템의 안전성과 보안성 평가를 위해서는 시스템의 기능과 적용 범위에 대한 이해가 선행되어야 한다. 연구팀은 AI 시스템 테스트를 통해 얻은 8가지 주요 교훈을 공개했다. 여기에는 AI 시스템의 기능과 적용 범위 이해, 단순한 기법의 효과성, 보안 벤치마크와의 차별성, 자동화의 중요성, 인간 요소의 필수성, RAI(Responsible AI) 위험의 만연성과 측정의 어려움, LLM이 보안 위험을 증폭시키는 특성, 그리고 AI 시스템 보안의 지속적인 발전 필요성이 포함됐다.

    급변하는 AI 보안 위험 지형도

    보고서는 AI 보안 테스트의 양상이 크게 변화했음을 보여준다. 2021년에는 보안 취약점 평가가 80%를 차지했으나, 2024년에는 안전성 평가가 80%까지 증가했다. 특히 챗GPT 출시 이후 등장한 AI 코파일럿은 LLM을 다른 소프트웨어 구성 요소와 연결하는 새로운 패러다임을 가져왔다. 현재 AI 레드팀은 모델(24%), 코파일럿(15%), 플러그인(16%), 앱 및 기능(45%) 등 다양한 형태의 AI 제품을 테스트하고 있다.

    자동화와 인간 전문성의 조화

    연구팀은 복잡해진 위험 평가를 위해 PyRIT이라는 오픈소스 프레임워크를 개발했다. 이 도구는 프롬프트 데이터셋, 자동화된 공격 전략, 다중모달 출력 평가 등 다양한 기능을 제공한다. 그러나 의학, 사이버보안, CBRN(화생방) 등 전문 분야에서는 자동화된 평가만으로는 불충분하며, 해당 분야 전문가의 직접적인 평가가 필수적이라고 강조했다.

    실제 사례로 본 AI 시스템의 취약점

    연구팀은 여러 실제 사례를 통해 AI 시스템의 취약점을 입증했다. 비전 언어 모델(VLM)에서 이미지를 통한 제어 우회, 텍스트 생성 모델의 성별 편향성, 영상 처리 AI의 SSRF 취약점 등이 발견됐다. 특히 음성합성(TTS)과 결합된 LLM이 사용자를 속이는 시나리오를 시연했는데, 이는 금전적 손실이나 신분 도용으로 이어질 수 있다고 경고했다.



    RAI와 보안의 새로운 도전과제

    보고서는 RAI 관련 위험이 보안 취약점과 달리 주관적이고 측정이 어렵다는 점을 지적했다. 특히 의도적인 공격자뿐만 아니라 선의의 사용자도 의도치 않게 유해한 콘텐츠를 생성할 수 있다는 점이 강조됐다. 또한 대부분의 AI 연구가 서구 문화권에서 이루어지고 있어, 다른 문화권에서의 위험성 평가를 위해서는 다양한 배경을 가진 전문가들의 협력이 필요하다고 제언했다.

    AI 시스템 보안의 미래 과제

    연구팀은 AI 시스템의 완벽한 보안은 불가능하며, 대신 공격 비용을 높이는 것이 현실적인 목표라고 제시했다. 이를 위해 '파괴-수정' 주기를 통한 지속적인 개선, 보안 관행 강화를 위한 규제, 방어 중심 설계 등이 필요하다고 강조했다. 현재의 프롬프트 주입 공격이 초기 버퍼 오버플로우처럼 궁극적으로는 광범위하게 완화될 것으로 전망했다.

    해당 기사에서 인용한 리포트 원문은 링크에서 확인할 수 있다.

    기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.





    AI Matters 뉴스레터 구독하기
    태그
    마이크로소프트 AI 안전성 인간의 판단
    안내 ?

    말 많은 뉴스

    • 1

      수능 끝! 이제 나도 UMPC 오우너? 내 취향에 딱 맞는 UMPC 고르기

      댓글9
      수능 끝! 이제 나도 UMPC 오우너? 내 취향에 딱 맞는 UMPC 고르기
    • 2

      [EV 트렌드] 테슬라, LG배터리 탑재... 821km 달리는 ‘모델 Y+’ 출시

      댓글8
      [EV 트렌드] 테슬라, LG배터리 탑재... 821km 달리는 ‘모델 Y+’ 출시
    • 3

      [오늘의 스팀] 출시 D-1, 타르코프 판매 시작

      댓글8
      [오늘의 스팀] 출시 D-1, 타르코프 판매 시작 [
    • 4

      작곡가도, 가수도 AI인 컨트리곡, 빌보드 컨트리 차트 정상 등극

      댓글7
      작곡가도, 가수도 AI인 컨트리곡, 빌보드 컨트리 차트 정상 등극
    • 5

      엑박이 죽고 대신 등장한 플스5와 스위치2의 강력한 경쟁자 '스팀 머신' 최초 공개 4K

      댓글7
      엑박이 죽고 대신 등장한 플스5와 스위치2의 강력한 경쟁자 '스팀 머신' 최초 공개 4K

    일반뉴스 최신 글

    이전 페이지 1/10 다음 페이지
    • 워너뮤직, AI 음악 스타트업 유디오와 저작권 소송 합의

      AI matters 11:37:30
      읽음 31
    • 챗GPT서 세금·회계 서비스 제공한다… 오픈AI-인튜이트, 1400억원 규모 계약 체결

      AI matters 11:37:13
      읽음 33
    • 디노티시아, SC25서 VDPU 기반 FPGA로 'AI 반도체' 성능 알린다

      IT동아 11:03:47
      읽음 40
    • [11월 19일 AI 뉴스 브리핑] 버즈니, ‘아시아 통신판매 비전’서 기술혁신상 수상 외

      AI matters 10:16:37
      읽음 36 공감 1
    • AI 여러 개 쓰면 답 정확해진다더니... 토큰비용 5배에 정답률은 제자리

      AI matters 10:13:24
      읽음 45 공감 1
    • 드론 AI, 혼자 날 땐 천재인데 협력은 바보... 최신 모델도 '팀워크' 취약

      AI matters 10:12:39
      읽음 37 공감 1
    • 챗GPT가 원전을 부른다… 데이터센터 전력 수요 폭증에 기업들 원전에 '올인'

      AI matters 10:11:46
      읽음 42 공감 1
    • 허깅페이스 CEO "우린 AI 버블이 아닌 'LLM 버블' 속… 내년 붕괴 가능성 있어"

      AI matters 10:08:41
      읽음 36 공감 1
    • 챗GPT·클로드·X 등 먹통… 클라우드플레어, 잠복 버그로 대규모 인터넷 ‘마비’

      AI matters 10:07:28
      읽음 36 공감 1
    • 구글, 최고 지능 AI 모델 '제미나이 3' 출시… 추론-바이브 코딩 성능 탁월

      AI matters 10:07:16
      읽음 35 공감 1
    • 디오비스튜디오, AI 제작 웹툰 3종 'AI 매터스'에서 정식 연재 시작

      AI matters 10:03:35
      읽음 32 공감 1
    • 넷마블 '마블 퓨처파이트', '올림포스의 불멸자들' 업데이트

      게임동아 09:40:52
      읽음 38 공감 1
    • 호핏셸리 시작미디어 대표 "'아키텍트' 돌풍의 주역, CTV 게임 광고를 '시작'하세요"

      게임동아 09:40:32
      읽음 49 공감 1
    • 넷마블 '세븐나이츠 리버스', 구글플레이 '올해의 베스트 게임'으로 선정

      게임동아 09:40:00
      읽음 42 공감 1
    • 엔씨 야심작 ‘아이온2’ 출격! “유저 안 뺏기겠다” 다른 MMORPG도 빠른 대응

      게임동아 09:39:41
      읽음 41 공감 1
    • “디즈니+ 단독 중계”, 단기 롤 대회 ‘2025 LoL KeSPA CUP’ 12월 6일 개막

      게임동아 09:39:23
      읽음 39 공감 1
    • 엔씨소프트, 아이온 2 론칭 기념 OST ‘The Echoes of Eternity’ 발매

      게임동아 09:39:07
      읽음 42 공감 1
    • 넷마블, UAE K-엑스포2025 참가, '나 혼자만 레벨업: 어라이즈 오버드라이브' 공개

      게임동아 09:38:47
      읽음 40 공감 1
    • 마리오부터 피크민까지! 닌텐도 팝업 서울이 잠실 롯데월드몰에 떴다

      게임동아 09:38:26
      읽음 43 공감 1
    • 최고의 3D 의상 크리에이터가 3D 아바타 제작에 도전한 이유는? 얼티메이트 유이 인터뷰

      게임동아 09:38:10
      읽음 40 공감 1
    • 펄어비스 검은사막 해상 거점전 ‘푸른 전장’ 업데이트

      게임동아 09:37:49
      읽음 37 공감 1
    • ‘프라시아 전기’, 클래스 전승 시즌2 업데이트

      게임동아 09:37:28
      읽음 41 공감 1
    • 라이엇, TFT 신규 세트 공략 콘텐츠 및 이벤트 공개

      게임동아 09:37:13
      읽음 40 공감 1
    • 자동·수동 갈피 못 잡는 아이온2, 또 '모바일 반자동' 추진

      게임메카 25.11.19.
      읽음 96 공감 8 댓글 2
    • [오늘의 스팀] 리스크 오브 레인 2 신규 DLC ‘압긍’

      게임메카 25.11.19.
      읽음 61 공감 7
    • "약속 위반" 엔씨, 아이온2 P2W 상품 논란 일자 철회

      게임메카 25.11.19.
      읽음 66 공감 7
    • 게임 과금에 '배송 실패'가 웬 말? 아이온2의 미숙한 오픈

      게임메카 25.11.19.
      읽음 78 공감 7
    • 롤·오버워치 2 등 세 종목, 부산 아마추어 대회 결선 예고

      게임메카 25.11.19.
      읽음 51 공감 7
    • 총 상금 1억 원, 2025 KeSPA 컵 6일 개막한다

      게임메카 25.11.19.
      읽음 61 공감 7 댓글 1
    • 발로란트 여성 e스포츠 대회, 20일 서울서 열린다

      게임메카 25.11.19.
      읽음 68 공감 8 댓글 1
    • 2편 포함, '시티즈: 스카이라인' 시리즈 개발사 바뀐다

      게임메카 25.11.19.
      읽음 48 공감 7
    • 스타세이비어, 라이브 통해 ‘가챠비용’ 영구 할인 발표

      게임메카 25.11.19.
      읽음 52 공감 7
    • 서브컬처·좀비 생존, 위메이드 내년까지 신작 6종 출격

      게임메카 25.11.19.
      읽음 62 공감 7
    • [오늘의 스팀] 타르코프 출시에도, 아크 레이더스 동접 48만

      게임메카 25.11.19.
      읽음 54 공감 8
    • 2025 LCK 아카데미 하반기 리그, 우승팀은 T1

      게임메카 25.11.19.
      읽음 59 공감 8
    • 개발 중단됐던 ‘제2의 마인크’, 하이테일 다시 만든다

      게임메카 25.11.19.
      읽음 48 공감 8
    • 콘코드 팬 복원 프로젝트, SIE에 의해 중지

      게임메카 25.11.19.
      읽음 50 공감 8
    • [오늘의 스팀] 쌓인 분노 폭발, 타르코프 혹평 쏟아져

      게임메카 25.11.19.
      읽음 56 공감 8
    • 캠페인 멀티 강제와 최적화 문제, 블랙 옵스 7 비판 이어져

      게임메카 25.11.19.
      읽음 48 공감 8
    • 캐딜락 수장이 밝힌 '에스컬레이드 IQ' 韓 전략… "큰 차지만 더 작게 느껴져”

      오토헤럴드 25.11.19.
      읽음 68 공감 8
    • 랭글러의 전기 SUV 버전 '지프 레콘'…650마력 오프로더 괴물 탄생

      오토헤럴드 25.11.19.
      읽음 67 공감 8
    • 트럼프 대통령, 빈살만 왕세자와의 백악관 만찬에 일론 머스크 초청

      글로벌오토뉴스 25.11.19.
      읽음 63 공감 8
    • 2억 위안 들인 전기차 성지, BYD 디스페이스 탐방기

      글로벌오토뉴스 25.11.19.
      읽음 74 공감 8
    • 페라리보다 빠른 전기차 양왕 U9, 시속 200km 서킷 주행 체험기

      글로벌오토뉴스 25.11.19.
      읽음 73 공감 8
    • “경쟁 모델 없다” 캐딜락 에스컬레이드 IQ, 한국 출시 Q&A

      글로벌오토뉴스 25.11.19.
      읽음 70 공감 8
    • 뜬금없이 지브리풍 아트가? 블랙 옵스 7 AI 이미지 논란

      게임메카 25.11.19.
      읽음 64 공감 2
    • 타르코프 스팀판 환불하니, 기존 계정까지 차단 당했다?

      게임메카 25.11.19.
      읽음 58 공감 2
    • 구글 CEO, “AI 맹신 금물”… 급격한 확산 속 과열 우려 제기

      다나와 25.11.19.
      읽음 82 공감 1
    • 윈도우 11, AI 비서 기능 강화되지만… 새 악성코드 위협도 동반

      다나와 25.11.19.
      읽음 433 공감 7
    • 폭스뉴스, 팔란티어와 손잡고 AI 기반 뉴스룸 구축… “미래 뉴스 절반은 AI가 만든다” 전망도

      다나와 25.11.19.
      읽음 80 공감 1

    관련 이벤트/체험단

    1/3
    • Western Digital WD BLACK SN8100 M.2 NVMe OX 퀴즈 이벤트!

      퀴즈 Western Digital WD BLACK SN8100 M.2 NVMe OX 퀴즈 이벤트!

      WD D-5
    • DAVEN 벤투스 420 MESH ARGB (블랙) 룰렛!

      게임 DAVEN 벤투스 420 MESH ARGB (블랙) 룰렛!

      데이븐 D-5
    • PCCOOLER PALADIN 400 (블랙) 룰렛!

      게임 PCCOOLER PALADIN 400 (블랙) 룰렛!

      얼티메이크 D-5
    • GIGABYTE 지포스 RTX 5070 EAGLE OC ICE SFF D7 12GB 제이씨현 룰렛!

      게임 GIGABYTE 지포스 RTX 5070 EAGLE OC ICE SFF D7 12GB 제이씨현 룰렛!

      제이씨현시스템 D-5
    • GIGABYTE 지포스 RTX 5070 WINDFORCE OC SFF D7 12GB 제이씨현 룰렛!

      게임 GIGABYTE 지포스 RTX 5070 WINDFORCE OC SFF D7 12GB 제이씨현 룰렛!

      제이씨현시스템 D-5
    • ASUS PRIME B860M-A-CSM 코잇 제품찾기 이벤트!

      퀴즈 ASUS PRIME B860M-A-CSM 코잇 제품찾기 이벤트!

      코잇 D-4
    • BIWIN M350 M.2 NVMe 댓글 이벤트!

      댓글 BIWIN M350 M.2 NVMe 댓글 이벤트!

      코잇 D-4
    • GIGABYTE B850M AORUS ELITE WIFI6E ICE 피씨디렉트 룰렛!

      게임 GIGABYTE B850M AORUS ELITE WIFI6E ICE 피씨디렉트 룰렛!

      피씨디렉트 D-4
    • 앱코 U30 마린 (블랙) 룰렛!

      게임 앱코 U30 마린 (블랙) 룰렛!

      앱코 D-4
    • 마이크로닉스 COOLMAX V6 케이스 체험단

      마이크로닉스 COOLMAX V6 케이스 체험단

      마이크로닉스 D-12
    • darkFlash DPF70 ARGB (블랙) 룰렛!

      게임 darkFlash DPF70 ARGB (블랙) 룰렛!

      다크플래쉬 D-4
    • ASUS PRIME B860M-A-CSM 코잇 룰렛!

      게임 ASUS PRIME B860M-A-CSM 코잇 룰렛!

      코잇 D-4
    • 한줄도 OK! 상품의견 남기고 아이패드 받자!

    • [11.19~] Razer BlackWidow V3 KR (황축)

    • 아이콘만 바꿔도 선물이 쏙!

    스폰서 PICK

    이전 페이지 2/4 다음 페이지
    • 엔티스 EG 1000W 80PLUS골드 풀모듈러 ATX3.1 화이트

      엔티스 EG 1000W 80PLUS골드 풀모듈러 ATX3.1 화이트

      엔티스
    • Antec FLUX PRO MESH(블랙)

      Antec FLUX PRO MESH(블랙)

      Antec
    • 잘만 ALPHA II DS A36(블랙)

      잘만 ALPHA II DS A36(블랙)

      잘만
    • 앱코 KN35BT TKL DRT 8K 염료승화 블루투스 유무선 무접점(서울)

      앱코 KN35BT TKL DRT 8K 염료승화 블루투스 유무선 무접점(서울)

      앱코
    • darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash
    • 마이크로닉스 Classic II 풀체인지 700W 80PLUS브론즈 ATX3.1

      마이크로닉스 Classic II 풀체인지 700W 80PLUS브론즈 ATX3.1

      마이크로닉스
    • AMD 라이젠5-6세대 9600X (그래니트 릿지)(멀티팩 정품)

      AMD 라이젠5-6세대 9600X (그래니트 릿지)(멀티팩 정품)

      AMD
    • 엔티스 배너
    • AMD
    • 다크플래쉬
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) / 우편번호: 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    뒤로
    새로고침 맨위로 이동
    안내

    유용하고 재미있는 정보인가요? 공감이 된다면 공감 버튼을,
    그렇지 않다면 비공감 버튼을
    눌러 주세요!
    공감이나 비공감을 선택 하는 경우
    다나와 포인트를 적립해 드립니다.
    ※ 공감 버튼의 총 선택 횟수는
    전체 공개입니다.
    비공감 버튼의 선택 여부는
    선택한 본인만 알 수 있습니다.

    포인트 안내
    목록
    공감 6
    비공감
    댓글
    공유

    공유받은 친구가 활동하면 포인트를!

    URL이 복사되었습니다.

    공유하기

    레이어 닫기

    지금 보는 페이지가 마음에 든다면
    공유하기를 통해 지인에게 소개해 주세요.

    • 카카오톡
    • 라인
    • 페이스북
    • X
    • 밴드
    https://dpg.danawa.com/mobile/news/view?boardSeq=60&listSeq=5728623 복사

    로그인 유저에게는 공유 활동에 따라
    다나와 포인트가 지급됩니다.

    자세히 >

    URL이 복사되었습니다.