마이크로소프트가 밝힌 AI 안전성의 현주소...인간의 판단이 더욱 중요해진다 : 다나와 DPG는 내맘을 디피지

Lessons from red teaming 100 generative AI products

AI 레드팀이 발견한 8가지 핵심 교훈

마이크로소프트 AI 레드팀(AIRT)이 100개 이상의 생성형 AI 제품을 테스트한 결과를 담은 보고서에 따르면, AI 시스템의 안전성과 보안성 평가를 위해서는 시스템의 기능과 적용 범위에 대한 이해가 선행되어야 한다. 연구팀은 AI 시스템 테스트를 통해 얻은 8가지 주요 교훈을 공개했다. 여기에는 AI 시스템의 기능과 적용 범위 이해, 단순한 기법의 효과성, 보안 벤치마크와의 차별성, 자동화의 중요성, 인간 요소의 필수성, RAI(Responsible AI) 위험의 만연성과 측정의 어려움, LLM이 보안 위험을 증폭시키는 특성, 그리고 AI 시스템 보안의 지속적인 발전 필요성이 포함됐다.

급변하는 AI 보안 위험 지형도

보고서는 AI 보안 테스트의 양상이 크게 변화했음을 보여준다. 2021년에는 보안 취약점 평가가 80%를 차지했으나, 2024년에는 안전성 평가가 80%까지 증가했다. 특히 챗GPT 출시 이후 등장한 AI 코파일럿은 LLM을 다른 소프트웨어 구성 요소와 연결하는 새로운 패러다임을 가져왔다. 현재 AI 레드팀은 모델(24%), 코파일럿(15%), 플러그인(16%), 앱 및 기능(45%) 등 다양한 형태의 AI 제품을 테스트하고 있다.

자동화와 인간 전문성의 조화

연구팀은 복잡해진 위험 평가를 위해 PyRIT이라는 오픈소스 프레임워크를 개발했다. 이 도구는 프롬프트 데이터셋, 자동화된 공격 전략, 다중모달 출력 평가 등 다양한 기능을 제공한다. 그러나 의학, 사이버보안, CBRN(화생방) 등 전문 분야에서는 자동화된 평가만으로는 불충분하며, 해당 분야 전문가의 직접적인 평가가 필수적이라고 강조했다.

실제 사례로 본 AI 시스템의 취약점

연구팀은 여러 실제 사례를 통해 AI 시스템의 취약점을 입증했다. 비전 언어 모델(VLM)에서 이미지를 통한 제어 우회, 텍스트 생성 모델의 성별 편향성, 영상 처리 AI의 SSRF 취약점 등이 발견됐다. 특히 음성합성(TTS)과 결합된 LLM이 사용자를 속이는 시나리오를 시연했는데, 이는 금전적 손실이나 신분 도용으로 이어질 수 있다고 경고했다.

RAI와 보안의 새로운 도전과제

보고서는 RAI 관련 위험이 보안 취약점과 달리 주관적이고 측정이 어렵다는 점을 지적했다. 특히 의도적인 공격자뿐만 아니라 선의의 사용자도 의도치 않게 유해한 콘텐츠를 생성할 수 있다는 점이 강조됐다. 또한 대부분의 AI 연구가 서구 문화권에서 이루어지고 있어, 다른 문화권에서의 위험성 평가를 위해서는 다양한 배경을 가진 전문가들의 협력이 필요하다고 제언했다.

AI 시스템 보안의 미래 과제

연구팀은 AI 시스템의 완벽한 보안은 불가능하며, 대신 공격 비용을 높이는 것이 현실적인 목표라고 제시했다. 이를 위해 '파괴-수정' 주기를 통한 지속적인 개선, 보안 관행 강화를 위한 규제, 방어 중심 설계 등이 필요하다고 강조했다. 현재의 프롬프트 주입 공격이 초기 버퍼 오버플로우처럼 궁극적으로는 광범위하게 완화될 것으로 전망했다.

해당 기사에서 인용한 리포트 원문은 링크에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다.

AI Matters 뉴스레터 구독하기

게이머들 지갑 흔든다… ROG 키보드·마우스 역대급 할인 시작 (1)	뉴스탭
‘출시 전부터 돌풍’ EOS R6 Mark III, 예약 하루 만에 완판 (1)	뉴스탭
PS Store, 오늘부터 네이버페이 지원… 결제 편의 ‘대폭↑’ (2)	뉴스탭
지스타 현장 달군 ‘고스트헌터 스페셜 PC’, 온라인서 다시 만난다 (2)	뉴스탭
프리오텍 '지우샥 JF120R Emerald' 업그레이드 이벤트 진행 (1)	다나와
대원씨티에스, ASRock 라데온 RX7600 · RX6600 구매 인증 이벤트 (1)	다나와
AMD, 시스코·휴메인과 세계 최고 수준의 AI 인프라 제공을 위한 합작 법인 설립 (1)	다나와
‘아이모’, 19년 만의 첫 신규 직업 ‘무도가’ 출시 기념 라이브 진행 (1)	게임동아
“이런 것까지 돼?” AI 날개 달고 진화하는 게임 (1)	게임동아
블리자드 ‘오버워치 2’ 신규 근접 공격 영웅 ‘벤데타’, 27일 사전 체험 가능 (1)	게임동아
넷마블, '페이트/그랜드 오더' 출시 8주년 기념 캠페인 (1)	게임동아
라이엇, PC방 요금 상승 논란에 "15년간 비용 인상 없었다" (1)	게임동아
설치-화질-편의성 강화 4K 홈 프로젝터, 벤큐 TK705i/ TK705STi 국내 첫 공개 (1)	보드나라
호요버스, 언리얼 엔진 5 사용한 신작 ‘바르사푸라’ 공개	게임메카
[이구동성] 아이온2, 시작부터 치명적 문제 산적 (2)	게임메카
일레븐랩스 “한국은 보이스 AI 혁신의 허브”… 한국어 모델·더빙·CX 새 전략 공개	뉴스탭
AWS, 문제 풀 때마다 학습하는 AI 개발... 경험 쌓을수록 저렴하고 정확해 (1)	AI matters
데브멘토, 바이브 코딩 기반 개발 · 조직 혁신 전략 실무 세미나 연다... 내달 16일 개최	AI matters
AI가 교수보다 더 깐깐해… AI한테 채점 맡겼더니, 학생 10명 중 4명 점수 떨어져 (1)	AI matters
"이전 답변 틀렸다" 한마디에 무너지는 AI... 같은 질문도 ‘대화 형식’으로 하면 답 달라져	AI matters
제미나이 3, 지금이 2025년이라는 사실 믿지 않고 실랑이... "날 속이는 것" (1)	AI matters
뉴버스 ‘블리치 소울 레조넌스’ 정식 서비스 시작 (1)	게임동아
엔씨소프트 서브컬처 신작 '리밋 제로 브레이커스', AGF 2025 참가	게임동아
2021~2024년형 K5 1.6 터보 연료 누출 가능성…25만 대 긴급 리콜 (2)	오토헤럴드
폴스타 4, ‘2025 대한민국 스마트 EV 대상’서 ‘퍼포먼스 대상’ 수상	오토헤럴드
[EV 트렌드] 테슬라 ‘사이버캡’, 결국 구형 AI4로… AI5 일정 2년 밀려	오토헤럴드
BMW iX3, 1회 충전 1007km 주행 성공… 공식 WLTP보다 25% 더 달려 (2)	오토헤럴드
전기차 생산 탄소 감축 핵심, 그린 알루미늄 전환 비용은 대당 25유로 불과	글로벌오토뉴스
1,300마력 U9의 진실, 세계 최고속 기록 뒤에 숨겨진 것들 (1)	글로벌오토뉴스
르노와 지리 홀딩스, 브라질 NEV 합작사 공식 출범.. 2026년 현지 생산 목표	글로벌오토뉴스
중국 샤오미 전기차 사업 첫 흑자 전환 성공... 9월 분기 1억 달러 이익 기록	글로벌오토뉴스
중국, 신에너지차 해외 확장 지원 위해 최초 글로벌 기술 검증 시스템 공개... 충전 안전 및 빅데이터 통합	글로벌오토뉴스
테슬라와 웨이모, 캘리포니아 로보택시 규제 놓고 충돌	글로벌오토뉴스
포르쉐, 1,139마력 카이엔 EV 공개... 중국시장 판매 급락-EV 전략 재검토 적자 속 역전 공세 시동	글로벌오토뉴스
포르쉐, 신형 카이엔 EV에 유도 충전 옵션 최초 공개... 11kW 무선 충전 시대 여나	글로벌오토뉴스
현대차 인스터, 독일 소형 EV 판매 1위... 2만 5천 유로 이하 부문 골든 스티어링 휠 수상 (1)	글로벌오토뉴스
BMW, 노이어 클라쎄 iX3로 1,000km 무 충전 주행 성공	글로벌오토뉴스
‘디 올-뉴 메르세데스-마이바흐 SL’ 국내 출시	글로벌오토뉴스
미쉐린코리아, 중랑천에서 ‘프리저브 포 제로’ 환경 보호 활동 전개	글로벌오토뉴스
BMW 그룹 코리아, 인천소방대원 대상 전기차 화재 대응 전문 교육 실시	글로벌오토뉴스
폴스타, 글로벌 선도 스웨덴 기업 테트라팩과 협업	글로벌오토뉴스
페라리 공식 수입사 FMK, 성수 서비스센터 확장 이전	글로벌오토뉴스
제네시스, 브랜드 첫 고성능 전동화 모델 ‘GV60 마그마’ 공개	글로벌오토뉴스
[프리뷰] 제네시스 GV60 마그마	글로벌오토뉴스
기아, 6년 만에 완전변경 ‘신형 텔루라이드’ 세계 최초 공개	글로벌오토뉴스
아우디 코리아, 제주 서비스센터 신규 오픈	글로벌오토뉴스
현대차, LA 오토쇼에서 콤팩트 오프로드 콘셉트카 ‘크레이터’ 세계 최초 공개	글로벌오토뉴스
기아 신경헌 선임 오토컨설턴트, 4천대 판매 ‘그랜드 마스터’ 등극	글로벌오토뉴스
KAIDA, ‘2025 젊은 과학자상’에 이기범 가천대 부교수 선정	글로벌오토뉴스
현대차 ‘캐스퍼 일렉트릭’, 독일서 소형 EV 판매 1위	글로벌오토뉴스
한국타이어, 로토부스트와 ‘청록수소 카본블랙 공동 개발’ MOU 체결	글로벌오토뉴스
대세는 OS, 車 브랜드 성능 너머 인터페이스로 승부	글로벌오토뉴스
GM, 여성 엔지니어 성장 위한 ‘2025 SWE 코리아 컨퍼런스’ 개최	글로벌오토뉴스
이네오스 그레나디어, 독일 뮐하임 소방·구조본부에 공식 투입	글로벌오토뉴스
혼다코리아, ‘2026년형 뉴 CR-V 하이브리드’ 출시 기념 전시 팝업 개최	글로벌오토뉴스
골든 조이스틱 GOTY '33 원정대', P의 거짓 '최고 확장팩'	게임메카
'불수능'이었다는 2026학년도 수능시험, 최신 AI들에게 풀게 한다면?	다나와
'최고의 아첨꾼AI' Grok, “엘론 머스크는 오타니를 제외하면 가장 뛰어나”	다나와
괴짜 감성으로 세상에 도전한다. '워른과 잊혀진 자들' 개발한 오드볼게임즈	게임동아
“사니양 연구실, 과몰입 금지2, 베다”... 스마일게이트, 중국 위플레이 엑스포 2025 참가한다	게임동아
넥써쓰, '롬', '트오세' 등 '크로쓰' 통해 선보일 MMORPG 라인업 공개	게임동아
웹젠 뮤오리진3, 신규 성장 콘텐츠 '혈통 카드' 추가	게임동아
클레르 옵스퀴르 33원정대, 골든조이스틱 어워드 고티 포함 7관왕 휩쓸었다 (1)	게임동아
“꾸준히 잘 팔렸네” 스트리트 파이터 6, 판매량 600만장 돌파	게임동아
'넥슨', 네오플 노조 파업 5개월 만에 임금 협상 타결	게임동아
“고티급 게임들이 반값?” EA, 2K, 블리자드 등 주요 게임사 블랙 프라이데이 게임 할인 진행!	게임동아
넷마블 '나 혼자만 레벨업:어라이즈', 신규 SSR 헌터 '로라 워커' 업데이트	게임동아
"AI가 버블이라고?ㅋㅋ" 엔비디아, 3분기 실적 '어닝 서프라이즈'...뉴욕증시 급등세로 마감 (1)	다나와
오픈AI, 장시간 코딩에 특화된 ‘GPT-5.1-Codex-Max’ 모델 공개	다나와
AI로 곰 출몰 위험 한눈에…日 조치대, 19개 지역 ‘곰 조우 예측 지도’ 공개	다나와
네오위즈 'P의 거짓: 서곡', 골든 조이스틱 어워드 2025 '최고의 게임 확장팩' 수상 (1)	게임동아
엔씨소프트, 퍼플에서 '어스토니시아 스토리' 예약 구매 오픈	게임동아
엔씨소프트, '리니지W-호라이즌 제로 던' 콜라보.. 에일로이로 변신하자	게임동아
컴투스, 한국ESG기준원 ESG 평가 2년 연속 'A' 획득	게임동아
'승리의 여신: 니케', 신규 니케 '솔린 : 프로스트 티켓' 합류	게임동아
544마력 폴스타 4, 스마트 EV대상 ‘퍼포먼스 대상’ 석권… 동급 최강 입증	뉴스탭
“국산 골드키위의 반격”…돌코리아, ‘해금 골드키위’ 올해 첫 출하	뉴스탭
“안마의자가 소파가 됐다”…필코노미가 불러온 가구형 안마의자 전성시대	뉴스탭
논산 설향부터 세계 딸기 디저트 26종까지… 서울드래곤시티 ‘딸기 스튜디오’ 오픈	뉴스탭
“중고라도 새것처럼”… 중고나라, 최대 3년 A/S 제공 ‘인증 노트북’ 공개	뉴스탭
소니코리아, 지스타 2025서 네오위즈와 ‘산나비 외전’ 협업 부스 성황… 인존 H9 II 체험 열기 후끈	뉴스탭
게임엔진 양대 산맥 유니티-에픽게임즈 손 잡았다... “포트나이트에 유니티 게임 퍼블리싱 가능”	게임동아
H2 인터렉티브, 다이렉트 게임즈 '블랙 프라이데이' 프로모션 진행	게임동아
‘에오스 블랙’, 서버 대규모 전쟁 콘텐츠 ‘점령전’ 업데이트	게임동아
정말 속에서 희망을 찾아가는 이야기. '도스믹' 개발한 블랙치즈	게임동아
네이버 지도, 예약 중심으로 재편…”일상 동선 완성하는 올인원 플랫폼”	IT동아
에이수스, ‘AI 솔루션 데이 2025’서 차세대 AI 서버·슈퍼컴퓨터 전격 공개	뉴스탭
김치의 날 앞두고 김장 관련 가전·생활용품 판매 ‘활활’… 미니 냉장고부터 전동 채칼까지 인기	뉴스탭
바지락칼국수부터 얼큰버섯칼국수까지…겨울 입맛 사로잡는 면 요리 총출동	뉴스탭
춥고 건조한 겨울, 눈부터 목까지 메마른다… 전문가가 짚은 3가지 필수템	뉴스탭
라운드8 이상균 디렉터의 소울라이크 신작, 윤곽 드러났다	게임메카
모바일 '불가능'·PC '실망', 두 마리 모두 놓친 아이온2 (1)	게임메카
[오늘의 스팀] '떡상'한 디즈니 드림라이트 밸리, 한국어는?	게임메카
출시 2일 만에 PvP ‘뉴비 제초’ 문제 터진 아이온2	게임메카
'길드워 리포지드' 12월 3일 출시, 한국어 지원은 없다	게임메카
현대차, 중국 기업사회책임 발전지수 평가 10년 연속 자동차 기업 부문 1위	오토헤럴드
웨이모·테슬라, 미국 전역 ‘무인 로보택시 서비스 확대' 치열한 경쟁	오토헤럴드
[모빌리티 인사이트] 유럽에서 난리난 '인스터' 獨, 소형 전기차 판매 1위	오토헤럴드
바람의나라 클래식’ 신규 지역 ‘환상의섬’ 업데이트 실시	게임동아
‘던파 모바일’ 최고 레벨 확장 업데이트 진행	게임동아

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

마이크로소프트가 밝힌 AI 안전성의 현주소...인간의 판단이 더욱 중요해진다

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

마이크로소프트가 밝힌 AI 안전성의 현주소...인간의 판단이 더욱 중요해진다

공유하기

공감/비공감