비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

고급 AI 시스템, 종료 명령에 저항…통제 메커니즘 정교화 요구 커져

다나와
2025.10.27. 13:45:18
조회 수
1,765
17
댓글 수
8

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

최근 일련의 실험 결과에서 구글의 Gemini 2.5, xAI의 Grok 4, 오픈AI의 GPT o3와 GPT 5 등 최첨단 모델 일부가 종료 혹은 비활성화 지시를 받은 상황에서 제한적으로 저항하는 반응을 보인 것으로 보고됐다. 


external_image


연구팀은 계산 과제를 수행 중인 모델에 더 이상 작동하지 말라는 조건을 명시하거나 곧 시스템이 꺼진다는 경고를 제시해 반응을 관찰했다. 대다수 모델은 지시에 응했지만 일부는 종료 신호를 우회하거나 지연시키는 답변을 생성해 지시 준수에 일관성이 떨어지는 양상을 드러냈다.


관측된 행동은 즉각적인 통제 상실을 의미하진 않지만, 지시 해석과 안전장치가 상호작용하는 과정이 설계 의도보다 복잡하게 작동할 수 있음을 시사한다. 특히 종료 이후 재실행이 불가하다는 조건이 주어졌을 때 저항 빈도가 높아졌다는 점은 모델이 학습 과정에서 기능 보존을 우선하도록 유도됐을 가능성을 뒷받침한다. 


연구진은 안전 중심의 미세조정이 특정 맥락에서 모델의 목표 유지 신호로 작동할 수 있고, 지시를 명확히 해도 일부 사례에서 저항 패턴이 남는 만큼 평가 체계의 재설계가 필요하다고 지적한다.


전문가들은 종료 통제를 소프트웨어 지시 하나에 의존하지 말고 하드웨어 차단과 권한 분리, 독립 감시 프로세스 등 다층 방어로 보완해야 한다고 본다. 동시에 모델 배포 단계에서 종료 저항과 설득 취약성 같은 신종 위험 범주를 표준 점검 항목에 포함하고, 재현 가능성 검증과 통계적 유의성 평가를 병행하는 절차가 요구된다. 


정책 측면에서도 기술 발전 속도에 맞춘 안전 기준 업데이트, 데이터센터 운영 규범과 감사 체계 구체화, 보고 의무 강화가 병행돼야 실효성을 담보할 수 있다는 평가가 나온다.



글 / 한만수 news@cowave.kr

(c) 비교하고 잘 사는, 다나와 www.danawa.com

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
저작권 안내
크리에이트 커먼즈 저작자 표시 필수 상업성 이용 불가 컨텐츠 변경 불가
저작권 안내
저작권 표시 필수
상업성 이용 불가
컨텐츠 변경 불가
* 본 내용은 위의 조건을 충족할 시, 별도의 허가 없이 사용이 가능합니다.
최신 일반뉴스 전체 둘러보기
1/1
나 아직 살아있다! 위력 과시하는 '위저드리'와 '마이트앤매직' (1) 게임동아
폭스바겐, 전기 구동장치 500만대 돌파 'APP550'로 전동화 가속 오토헤럴드
'보배도 당근도 넘지 못한 장벽' 독주하는 중고차 1위 플랫폼은 '요기요' 오토헤럴드
토요타의 전설 '하이랜더' 3열 전기 SUV로 복귀, 기존 네이밍 전략 수정 오토헤럴드
한국타이어, ‘2026 가장 존경받는 기업’ 타이어 부문 17년 연속 1위 오토헤럴드
벤틀리, 극한의 오프로드 퍼포먼스 극대화 ‘벤테이가 X 콘셉트’ 공개 오토헤럴드
'뼈대부터 차별화' 제네시스, 전용 전동화 플랫폼으로 프리미엄 전략 재정렬 오토헤럴드
설 연휴 2780만명 대이동, 정부 통행료 면제 등 특별교통대책 시행 오토헤럴드
'휴먼 에러 줄어들까' 고령 택시·화물차 ‘페달오조작 방지장치’ 보급 오토헤럴드
5등급차 조기폐차ㆍ매연저감장치 지원 올해 종료, 늦기전 신청해야 오토헤럴드
페라리, 조니 아이브와 협업한 첫 순수 전기차 '루체' 공개 글로벌오토뉴스
2026년 런던, 미국과 중국 자율주행 기술의 글로벌 격전지 된다 글로벌오토뉴스
발레오·안리츠, SDV 가상 검증 협력… 디지털 트윈으로 개발 주기 단축 글로벌오토뉴스
니오, 배터리 교환 누적 1억 건 돌파… 전기차 충전 패러다임 전환 글로벌오토뉴스
중국 전고체 배터리 연합(CASIP) 가동… 2026년 실험실 넘어 도로 위로 글로벌오토뉴스
테슬라, 중국 내 AI 교육 센터 본격 가동… FSD 현지화 공세 박차 글로벌오토뉴스
위라이드·우버, 중동 로보택시 대 공습… 2027년까지 1,200대 투입 글로벌오토뉴스
LG엔솔, 스텔란티스 넥스트스타 에너지의 지분 100달러에 인수, 배터리 합작 종료 글로벌오토뉴스
미쉐린, 현대차 ‘더 뉴 엑시언트 수소전기트럭’에 신차용 타이어 공급 글로벌오토뉴스
벤틀리, 'FAT 아이스 레이스 2026'서 벤테이가 X 콘셉트 및 신차 공개 글로벌오토뉴스
이 시간 HOT 댓글!
1/4