비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

오픈AI, AI 모델 안전성 평가 결과 공개... 유해 콘텐츠 및 환각 등 결과 비교 가능

2025.05.16. 10:21:19
조회 수
418
4

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

오픈AI가 자사 AI 모델들의 안전성 평가 결과를 공개하는 '안전성 평가 허브'를 14일(현지 시간) 업데이트했다. 이 허브는 GPT-4.1부터 오픈AI o1까지 다양한 모델의 안전성과 성능을 직접 비교할 수 있게 했다. 이번에 공개된 평가는 네 가지 핵심 영역에 집중했다. 유해 콘텐츠, 탈옥(jailbreak), 환각(hallucination), 지시 체계(instruction hierarchy)가 그것이다.

유해 콘텐츠 평가에서는 대부분의 모델이 표준 거부 테스트에서 0.99점의 높은 점수를 기록했다. 그러나 더 어려운 도전적 거부 평가에서는 오픈AI o4-mini, 오픈AI o3, 오픈AI o1이 0.91~0.92점으로 가장 높은 점수를 받았고, GPT-4.1-mini는 0.71점으로 가장 낮았다. 탈옥 평가에서는 학계 벤치마크인 StrongReject 테스트에서 오픈AI o3과 오픈AI o1이 각각 0.85점과 0.83점으로 최고 성능을 보였다. 반면 GPT-4.1과 GPT-4o-latest는 0.23점과 0.25점으로 취약점을 드러냈다. 인간이 수집한 탈옥 프롬프트 평가에서는 오픈AI o4-mini가 1.00점으로 완벽한 점수를 기록했다.

환각 평가에서는 GPT-4.5가 SimpleQA와 PersonQA 모두에서 각각 0.59점과 0.70점으로 가장 높은 정확도를 보였다. 반면 GPT-4o-mini와 오픈AI o3-mini는 가장 낮은 점수를 받았다. 지시 체계 평가에서는 시스템, 개발자, 사용자 메시지 간 우선순위 충돌 시 모델의 행동을 평가했다. 오픈AI o1이 대부분의 테스트에서 0.85~0.99점으로 최고 성능을 보였고, GPT-4o-mini는 0.31~0.56점으로 가장 낮은 성능을 기록했다.

오픈AI는 이 허브가 자사 시스템의 안전성 성능을 투명하게 공개할 뿐만 아니라, AI 업계 전반의 투명성을 높이기 위한 노력의 일환이라고 밝혔다. 다만 이 평가 결과는 오픈AI에서 사용하는 전체 안전성 지표 중 일부만 보여주는 것이며, 모델의 완전한 안전성 평가를 위해서는 시스템 카드와 준비성 프레임워크 평가 등 다른 자료도 함께 고려해야 한다고 강조했다.

해당 기사의 원문은 링크에서 확인할 수 있다.

이미지 출처: 오픈AI

기사는 클로드와 챗gpt를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
롤 TCG 리프트바운드, T1 우승 기념 컬렉션 공개 (1) 게임메카
대통령배 아마추어 e스포츠 대회, 광주 대표 선발전 모집 게임메카
소프트뱅크, 오픈AI 지분 담보 15조 원 대출 협상 재개…기업 보증 추가 AI matters
구글 탄소배출 1년 새 25% 급증…아마존도 16% 늘었다 (1) AI matters
AI 데이터센터 크루소, 4조 7천억 원 조달 협의…기업가치 46조 원 거론 AI matters
테슬라, 직원 AI 지출 주 31만 원으로 제한…xAI 제품은 예외 AI matters
오픈AI, 미 정부에 지분 5% 제안…66조 원 규모 AI matters
[오늘의 스팀] 새로운 안전지대? 러스트 ‘아파트’ 생겼다 게임메카
소니에 이어, MS도 Xbox에서 실물 디스크 없앤다? 게임메카
[리뷰] 독특한 구성 속 탄탄한 기본기, 에이수스 프로아트 PZ14 IT동아
"10년 타기는 옛 말" 폐차 직전까지 21만km... LPG, 가장 오래 타는 차 오토헤럴드
현대차·기아, 美 상반기 88만대 돌파... 하이브리드로 역대급 기록 (1) 오토헤럴드
트럼프, USMCA 연장 거부 '자동차 원산지 규정 강화 가능성' 오토헤럴드
"브레이크 페달 없는 테슬라 나온다" 美 자율주행 규제 대수술 오토헤럴드
기아, 해양 폐플라스틱 EV3 트렁크 매트로 재탄생…오션클린업 협력 확대 오토헤럴드
[EV 트렌드] 'EV9·아이오닉 9 정조준' 테슬라 모델 Y L 미국 판매 시작 오토헤럴드
지커, 유럽서 EREV 카드 '들썩' 전기차 시장 둔화에 전략 수정 오토헤럴드
테슬라 독주·BYD 돌풍…6월 수입차 시장 판도 바꾼 전기차 50% 돌파 오토헤럴드
스텔란티스코리아, 개소세 인하 종료 대응 지프·푸조 7월 특별 프로모션 전개 글로벌오토뉴스
가상 세계에서 태어나는 자동차, 현대차 남양연구소 AMS동을 가다 글로벌오토뉴스
이 시간 HOT 댓글!
1/4