비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

앤트로픽, 새로운 ‘버그 바운티 프로그램’으로 안전성 방어 체계 테스트 시작

2025.05.16. 10:23:22
조회 수
370
4

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

앤트로픽(Anthropic)이 안전 대책을 테스트하기 위한 새로운 버그 바운티 프로그램을 15일(현지 시간) 시작했다. 앤트로픽 뉴스룸에 공개된 내용에 따르면, 이번 프로그램은 작년 여름에 발표된 이전 프로그램과 유사하며, 연구자들에게 아직 공개적으로 배포되지 않은 안전 분류기에서 일반적인 탈옥(universal jailbreaks) 취약점을 찾아내는 도전을 제안했다. 이러한 보호 장치는 앤트로픽의 책임감 있는 확장 정책(Responsible Scaling Policy)의 일환으로 AI 안전 레벨-3(ASL-3) 배포 표준을 충족하기 위해 개발된 고급 보호 기능의 일부다.

해커원(HackerOne)과 협력하여 진행되는 이 버그 바운티 프로그램은 앤트로픽의 헌법 분류기(Constitutional Classifiers) 시스템의 업데이트 버전을 테스트할 예정이다. 헌법 분류기는 CBRN(화학, 생물학, 방사능, 핵) 무기와 관련된 정보를 유출할 수 있는 탈옥을 방지하기 위해 구축된 기술이다. 이 시스템은 클로드(Claude)와 상호작용할 때 허용되거나 허용되지 않아야 하는 콘텐츠 유형을 정의하는 원칙 목록을 따르며, 특정 위험에 초점을 맞추고 있다.

참가자들은 클로드 3.7 소네트(Claude 3.7 Sonnet)에서 분류기를 테스트할 수 있는 조기 액세스 권한을 받게 된다. 앤트로픽은 미공개 시스템에서 발견된 검증된 일반 탈옥 취약점에 대해 최대 2만 5천 달러의 보상금을 제공한다. 일반 탈옥 취약점은 다양한 주제에 걸쳐 클로드의 안전 조치를 일관되게 우회할 수 있는 취약점을 의미한다. 이번 이니셔티브에서는 CBRN 관련 주제에 대한 오용을 가능하게 하는 일반 탈옥 취약점에 관심을 두고 있다.

앤트로픽은 "우리의 모델은 점점 더 강력해지고 있으며, 이전에 공유했듯이 일부 미래 모델은 책임감 있는 확장 정책에 명시된 고급 ASL-3 보안 및 안전 보호 기능이 필요할 수 있다고 생각한다"고 밝혔다. 이 버그 바운티 이니셔티브는 지난 몇 개월 동안 ASL-3 안전장치를 반복하고 스트레스 테스트하기 위해 수행한 작업에 기여할 것이라고 덧붙였다.

앤트로픽은 작년 초기 프로그램에 참여한 연구자들의 참여로 이번 새로운 버그 바운티 이니셔티브를 시작했으며, 새로운 연구자들에게도 참여 기회를 제공하고 있다. 언어 모델에서 탈옥을 식별하는 경험이 풍부한 레드팀 또는 입증된 전문 지식을 보유한 경우 신청 양식을 통해 초대를 신청할 것을 권장했다. 자세한 지침과 피드백은 선정된 참가자들에게 공유될 예정이다. 신청은 오늘부터 시작되며, 프로그램은 5월 18일 일요일까지 진행된다. 이 이니셔티브는 제출물에 대한 시기적절한 피드백을 제공하기 위해 초대 전용으로 운영된다.

해당 기사의 원문은 링크에서 확인할 수 있다.

이미지 출처: 앤트로픽

기사는 클로드와 챗gpt를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
SIEK, 르세라핌 김채원과 함께하는 플레이스테이션 이벤트 'Love of Play' 캠페인 진행 게임동아
매치3 지겹잖아! 인디 열정으로 만든 방과 문의 두뇌 유희. ‘도어퍼즐’ 게임동아
글로벌 순방 마치고 오는 '바이오하자드 서바이벌 유닛' 기대감 UP 게임동아
현대차 팰리세이드, ‘북미 올해의 차’ 석권하며 글로벌 연간 판매 신기록 달성 (1) 글로벌오토뉴스
[컨슈머인사이트] 커넥티드 카 보급률 97% 달성… 하지만 AI 기능은 여전히 ‘불모지’ 글로벌오토뉴스
오토노머스에이투지-택시연합회, 법인택시 자율주행 전환 위한 업무협약 체결 글로벌오토뉴스
테슬라, 미국서 4만 1990달러 ‘모델 Y’ 신규 트림 출시 글로벌오토뉴스
"글로벌 1위의 굴욕" BYD, 1월 판매 30% 급감하며 5개월째 내리막 글로벌오토뉴스
현대자동차, 러시아 공장 ‘재매입’ 포기… 15년 만에 현지 생산 마침표 글로벌오토뉴스
ZF-BMW, 8단 자동변속기 장기 공급 계약 체결 글로벌오토뉴스
기아의 연간 300만대 생산과 37년 전의 30만대 생산 글로벌오토뉴스
현대차, 1월 글로벌 판매 1.0% 감소…국내는 9% 성장 오토헤럴드
르노코리아 1월 판매 3,732대…국내 감소·해외 수출 증가 오토헤럴드
GM 한국사업장 1월 판매 4만4,703대…전년 대비 41.4% 급증 오토헤럴드
기아 1월 판매 ‘국내 회복·해외 안정’…글로벌 24만대 돌파 오토헤럴드
KG 모빌리티 1월 판매 8,836대…무쏘 효과로 전년 대비 9.5% 증가 오토헤럴드
국내 완성차 5개사 1월 판매 61만대 돌파…전년 대비 2.7% 증가 오토헤럴드
현대차 팰리세이드, 차세대 하이브리드 날개 달고 연간 최다 판매 신기록 오토헤럴드
디 올-일렉트릭 MINI 쿠퍼, 유로 NCAP ‘2025 가장 안전한 도심형 소형차’ 오토헤럴드
차량 커넥티드카 서비스 '무료→유료' 전환율 6%... AI는 ‘개점휴업’ 오토헤럴드
이 시간 HOT 댓글!
1/4