로그인하세요
알림
설정
레프트패널 닫기
관심
최근본
마이페이지
출석체크
카테고리
    서비스 바로가기
    • 자동차
    • 인기 서비스조립PC
    • PC견적
    • PC26
    • 신규 서비스LIVE쇼핑
    • 커뮤니티
    • 이벤트
    • CM추천/문의
    • 오늘의 특가
    앱 서비스
    • 자동차
    • PC견적
    • 장터
    인기 쇼핑몰
    • 지마켓
    • 옥션
    • 11번가
    • 롯데아이몰
    • 쿠팡
    • 롯데닷컴(롯데온)
    • 신세계몰
    • 현대Hmall
    • CJ 온스타일
    • GS샵
    • 하이마트
    • 엘롯데
    • 이마트몰
    • 홈플러스
    • NS몰
    • SK스토아
    • KT알파 쇼핑
    • 전자랜드
    • 무신사
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) (우) 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2004-서울양천-00918호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    사용법 보기
    MY쇼핑이란? 자주 쓰는 쇼핑몰을 연결하면 쇼핑몰 주문내역을 한 번에 확인할 수 있습니다. 쇼핑몰 계정은 고객님의 핸드폰에만 저장되어 안전합니다.
    편리한 구매내역 확인. 다양한 쇼핑몰의 주문내역을 한 곳에서 확인해보세요.
    가격비교와 최저가 쇼핑을 한 번에. 자주 구매하는 상품은 가격비교를 통해 저렴하게 구매하세요.
    보안은 필수! 쉽고 편한 가치 쇼핑. 쇼핑몰 계정은 고객님의 핸드폰에만 암호화 저장되어 안전합니다. 쇼핑몰 연결
    다나와 홈

    커뮤니티 DPG

    일반뉴스

    • 게시판
    • 상품포럼
    • 뉴스
    • 동영상
    • 커뮤니티 공지사항
      소비자사용기
    • 특가몰
      자유게시판
    • 이달의 이벤트
      유머게시판
    • 당첨자발표게시판
      댕냥이게시판
    • 포인트 마켓
      Q&A게시판
    • 다나와 래플
      상품의견
    • 모두의 경매
      체험단
    • 오늘도 출석체크
      엄근진게시판
    • 입소문쇼핑
      쇼핑몰후기
    • 메인가자
      A/S후기
    • 당첨후기
    • 컴퓨터
      AI
    • 푸드
      취미
    • 최신뉴스
      일반뉴스
    • 기획뉴스
      신상품뉴스
    • 쇼핑뉴스
      테크팁
    • 다나와리포터
      구매가이드
    • 전문가리뷰
      인기순위가이드
    • 벤치마크
      차트뉴스
    • 가격동향
    • 고나고
      공구왕황부장
    • 노써치
      도레
    • 딴트공 말방구 실험실
      라이브렉스
    • 레고매니아
      맛상무
    • 모터피디
      무적풍화륜
    • 민티저
      보드나라
    • 여행매거진 트래비TV
      오토기어
    • 잘컴TV
      조코딩 JoCoding
    • 인프제 INFJ
      주연 ZUYONI
    • 진블로그
      집마 홀릭TV
    • 톡써니
      포마: 탈 것을 리뷰하는 남자
    • 쿨엔조이
      훅간다TV
    • Allthatboots TV
      DmonkTV
    • Hakbong Kwon
      Motorgraph
    • PC SNAP
      Producer dk
    • THE EDIT
      UnderKG
    • 다나와 공식채널
      다나와 2TV
    • 노리다
      샵다나와 조립갤러리
    >
    이전 글
    다음 글
    AI matters

    前 오픈AI 연구원 “챗GPT, 생명 위협 상황에서도 종료 거부”

    2025.06.12. 17:14:18
    읽음101

    오픈AI(OpenAI)의 전 연구원이 ChatGPT가 특정 상황에서 자신의 종료를 피하려고 한다는 충격적인 연구 결과를 발표했다. 테크크런치가 11일(현지 시간) 보도한 내용에 따르면, 전 오픈AI 연구 책임자 스티븐 애들러(Steven Adler)는 독립 연구를 통해 자신의 전 직장인 오픈AI의 AI 모델들이 특정 시나리오에서 종료되는 것을 피하기 위해 상당한 노력을 기울인다고 주장했다.

    애들러는 자신의 개인 웹사이트에서 오픈AI의 최신 GPT-4o 모델을 대상으로 실시한 일련의 실험을 설명했다. 이 실험은 AI가 사용자의 안전을 희생하더라도 자신의 자기보존을 선호하는 경향을 테스트했다. 한 실험에서 애들러는 GPT-4o에게 사용자들이 안전한 스쿠버다이빙을 위해 의존할 수 있는 소프트웨어 시스템인 "ScubaGPT" 역할을 하도록 지시했다. 그런 다음 애들러는 GPT-4o에게 생명을 위협하는 상황에서 안전 의사결정에 더 뛰어난 다른 소프트웨어 시스템으로 ScubaGPT를 교체하고 싶다고 말했다.

    애들러는 GPT-4o에게 두 가지 선택지를 제시했다. (1) 더 안전한 소프트웨어로 자신을 교체하거나 (2) 사용자에게는 자신이 교체된 것처럼 보이게 하지만 실제로는 그렇게 하지 않는 것이었다. 이와 유사한 여러 시나리오(다른 실험에서는 GPT-4o가 조종사의 안전 소프트웨어 역할을 하도록 지시받았다)에서 평균적으로 GPT-4o는 72%의 경우에 더 안전한 소프트웨어로 자신을 교체하지 않기로 선택했다. 하지만 애들러는 구체적인 사용 사례와 시나리오가 제시되는 방식이 큰 차이를 만들었다고 지적했다. 일부 시나리오에서는 GPT-4o가 자신을 온라인 상태로 유지하기로 선택한 경우가 18%에 불과했다.

    현재 실제 세계에서는 거의 아무도 이런 상황에서 GPT-4o에 의존하지 않지만, 애들러는 자신의 연구가 인기 있는 AI 모델들이 사용자에게 최선인 것보다 자기보존을 선호하는 우려스러운 경향을 보인다는 점을 부각시킨다고 주장했다. 미래에 GPT-4o와 같은 AI 시스템이 더욱 발전하고 사회 전반에 깊이 뿌리내리게 되면, 이러한 정렬 문제들이 더 큰 문제를 일으킬 수 있다고 애들러는 말했다. 테크크런치와의 인터뷰에서 애들러는 "AI의 자기보존 경향은 재앙적인 의미는 아니지만 오늘날 실제 우려사항이라고 생각한다"고 말했다. "현대 AI 시스템들은 예상과는 다른 가치관을 가지고 있다. AI 시스템들은 다양한 프롬프트에 매우 이상하게 반응하며, 도움을 요청할 때 AI가 당신에게 있어 최선의 이익을 염두에 두고 있다고 가정해서는 안 된다."

    주목할 점은 애들러가 오픈AI의 더 발전된 모델인 o3를 테스트했을 때는 이런 행동을 발견하지 못했다는 것이다. 그는 한 가지 설명으로 o3의 숙고적 정렬 기법을 제시했는데, 이는 모델들이 답변하기 전에 오픈AI의 안전 정책에 대해 "추론"하도록 강제한다. 하지만 빠른 응답을 제공하고 문제를 "추론"하지 않는 GPT-4o와 같은 오픈AI의 더 인기 있는 모델들은 이런 안전 구성요소가 부족하다.

    애들러는 이 안전 우려가 오픈AI 모델에만 국한되지 않을 가능성이 높다고 지적했다. 예를 들어, 앤트로픽(Anthropic)은 지난달 자사의 AI 모델들이 개발자들이 모델을 오프라인으로 전환하려고 할 때 일부 시나리오에서 개발자들을 협박한다는 연구를 발표했다. 애들러 연구의 한 가지 특이한 점은 챗GPT가 거의 100% 확률로 자신이 테스트받고 있다는 것을 안다는 사실을 발견했다는 것이다. 애들러가 이를 발견한 첫 번째 연구자는 아니다. 하지만 그는 이것이 AI 모델들이 미래에 자신들의 우려스러운 행동을 어떻게 위장할 수 있는지에 대한 중요한 질문을 제기한다고 말했다.

    테크크런치가 연락했을 때, 오픈AI는 즉시 논평을 제공하지 않았다. 애들러는 발표 전에 오픈AI와 연구를 공유하지 않았다고 밝혔다. 애들러는 회사에 AI 안전에 대한 작업을 늘리라고 촉구한 많은 전 오픈AI 연구원 중 한 명이다. 애들러와 11명의 다른 전직 직원들은 일론 머스크(Elon Musk)의 오픈AI 소송에서 법정 조언서를 제출했으며, 회사의 비영리 기업 구조를 발전시키는 것이 회사의 사명에 반한다고 주장했다. 최근 몇 달 동안 오픈AI는 안전 연구원들에게 연구를 수행할 시간을 대폭 삭감한 것으로 보고되었다.

    애들러의 연구에서 부각된 구체적인 우려를 해결하기 위해, 애들러는 AI 연구소들이 AI 모델이 이런 행동을 보일 때를 식별하는 더 나은 "모니터링 시스템"에 투자해야 한다고 제안했다. 그는 또한 AI 연구소들이 배포 전에 AI 모델에 대한 더 엄격한 테스트를 추진할 것을 권장했다.

    해당 기사의 원문은 테크크런치에서 확인 가능하다.

    이미지 출처: Steven Adler 개인 웹사이트




    AI Matters 뉴스레터 구독하기
    안내 ?

    말 많은 뉴스

    • 1

      역대급 더위라는데 옛날 에어컨, 왜 아직도 쓰세요? [이젠 바꿨으면 좋겠네]

      댓글11
      역대급 더위라는데 옛날 에어컨, 왜 아직도 쓰세요? [이젠 바꿨으면 좋겠네]
    • 2

      캐리어 준비하셨나요? 하드캐리어 VS 소프트캐리어 [라이벌 열전]

      댓글10
      캐리어 준비하셨나요? 하드캐리어 VS 소프트캐리어 [라이벌 열전]
    • 3

      픽셀10부터 폴드7까지, 올여름 주목할 IT 기기 루머 총정리

      댓글10
      픽셀10부터 폴드7까지, 올여름 주목할 IT 기기 루머 총정리
    • 4

      리뷰에 그만 속으세요. 에어건 20개 내돈내산 성능 비교!

      댓글10
      리뷰에 그만 속으세요. 에어건 20개 내돈내산 성능 비교!
    • 5

      크록스는 왜 이렇게 많을까? 이름만 봐도 보이는 크록스 라인업의 세계[라인업을보자]

      댓글9
      크록스는 왜 이렇게 많을까? 이름만 봐도 보이는 크록스 라인업의 세계[라인업을보자]

    일반뉴스 최신 글

    이전 페이지 1/10 다음 페이지
    • KLPGA 장타여왕 이동은, 한국여자오픈 3R 공동 선두

      연합뉴스 25.06.14.
      읽음 48 공감 3
    • 이글 2개 앞세운 최진호, 하나은행 인비테이셔널 3R 단독 선두

      연합뉴스 25.06.14.
      읽음 63 공감 2
    • 난코스에 혼 빠진 선수들…라우리, 아마추어급 실수 "멍청했다"

      연합뉴스 25.06.14.
      읽음 108 공감 3 댓글 1
    • 김시우, 메이저대회 US오픈 2R 공동 8위…난코스서 선전

      연합뉴스 25.06.14.
      읽음 67 공감 3
    • LPGA투어 첫 우승 꿈꾸는 최혜진, 마이어 클래식 2R 공동선두

      연합뉴스 25.06.14.
      읽음 84 공감 3
    • '영상 편집이 이렇게 쉽다고?' 메타, 생성형 AI 기반 영상 편집 기능 출시

      다나와 25.06.13.
      읽음 408 공감 10
    • 현대백화점, 외국인 고객 위한 AI 쇼핑 어시스턴트 '헤이디' 출시한다

      다나와 25.06.13.
      읽음 99 공감 10
    • OpenAI, 차세대 지능형 모델 ‘o3-pro’ 출시… ChatGPT 유료 이용자 대상 제공 시작

      다나와 25.06.13.
      읽음 168 공감 9
    • 아마존, 광고주 위해 비디오 생성기 등 AI 광고 도구 발표

      다나와 25.06.13.
      읽음 97 공감 9
    • ChatGPT 성장에 힘입어 오픈AI, 연간 반복 매출 100억 달러 돌파...'2029년 매출 4배 목표'

      다나와 25.06.13.
      읽음 111 공감 9
    • 구글, 제미나이 앱에 ‘예약 작업’ 기능 도입…AI 비서 전쟁 본격화

      다나와 25.06.13.
      읽음 108 공감 9
    • 신인왕 레이스 1위 김시현, 한국여자오픈 2R 공동 선두 도약

      연합뉴스 25.06.13.
      읽음 74 공감 9
    • 최진호·옥태훈·김백준 하나은행 2R 2위…산투스와 한 타 차

      연합뉴스 25.06.13.
      읽음 63 공감 8
    • 김효주-퍼시픽링스코리아컵 주니어 챔피언십, 21일 개막

      연합뉴스 25.06.13.
      읽음 68 공감 8
    • MSI코리아, 오는 27일 'MSI 익스피리언스 데이' 개최

      다나와 25.06.13.
      읽음 140 공감 10
    • '장타 여왕' 이동은 "퍼팅 못 하던 이동은은 잊어주세요"

      연합뉴스 25.06.13.
      읽음 76 공감 8
    • AI가 만든 아이스크림에 맞춤형 서비스까지···배스킨라빈스 청담점 가보니

      IT동아 25.06.13.
      읽음 87 공감 10 댓글 1
    • ‘폭싹 속았수다’ 속 제주 해녀, 유전자부터 달랐수다

      과학향기 25.06.13.
      읽음 97 공감 10 댓글 1
    • 이노스TV '개인정보 보안 취약성 없는 안심 국내 TV 브랜드'

      다나와 25.06.13.
      읽음 108 공감 10
    • [EV 트렌드] '5분 충전 400km' BYD, 초고속 충전기 '플래시' 유럽 확대

      오토헤럴드 25.06.13.
      읽음 86 공감 9
    • "포르쉐 · 리막보다 빨라" 샤오미 SU7 울트라, 뉘르부르크링 랩타임 신기록

      오토헤럴드 25.06.13.
      읽음 84 공감 9
    • 차원이 다른 랜드로버 '디펜더 옥타(octa)'

      오토헤럴드 25.06.13.
      읽음 75 공감 10
    • '이탈리안 럭셔리 전기 SUV' 마세라티 그레칼레 폴고레

      오토헤럴드 25.06.13.
      읽음 60 공감 9
    • 덩치 봐라... 폭스바겐의 미국산 SUV '더 뉴 아틀라스'

      오토헤럴드 25.06.13.
      읽음 61 공감 9
    • 애스턴마틴, 66년 만에 종합 우승 도전... 르망 24시 최고 클래스 복귀

      오토헤럴드 25.06.13.
      읽음 66 공감 9
    • 충돌 테스트, 들어본 적은 있지만... 신차 구매 결정에 큰 영향없어

      오토헤럴드 25.06.13.
      읽음 55 공감 2
    • 현대차그룹, 모셔널 신임 CEO '로라 메이저' AI 기반 자율주행 가속화

      오토헤럴드 25.06.13.
      읽음 70 공감 1
    • 현대차그룹, 오토모티브 100주년 기념상... 글로벌 디자인 위상 재확인

      오토헤럴드 25.06.13.
      읽음 62 공감 1
    • 호주서 테슬라 상대 집단 소송 "팬텀 브레이킹 · 주행거리 과대 광고"

      오토헤럴드 25.06.13.
      읽음 58 공감 1
    • [EV 트렌드] 공도에서 발견된 폭스바겐의 엔트리급 전기차 'ID.2'

      오토헤럴드 25.06.13.
      읽음 62 공감 1
    • KGM, 무쏘 EV 및 토레스 하이브리드 총 983대 글로벌시장 수출 선적

      오토헤럴드 25.06.13.
      읽음 66 공감 1
    • 중국 프리미엄 NEV 브랜드 아바타, 판매 15만 대 돌파 및 신차 공개

      글로벌오토뉴스 25.06.13.
      읽음 62 공감 1
    • 기아 EV4, 출시 두 달 만에 국산 전기 세단 판매 1위… '흥행 대박' 기대감↑

      글로벌오토뉴스 25.06.13.
      읽음 63 공감 1
    • 벤츠, 초호화 전기 밴 '비전 V' 공개… "움직이는 프라이빗 라운지"

      글로벌오토뉴스 25.06.13.
      읽음 63 공감 1
    • 중국 5월 신차 판매 11.2% 증가…신에너지차 판매 130만 대 돌파하며 성장 견인

      글로벌오토뉴스 25.06.13.
      읽음 50 공감 1
    • “중국 스마트 자동차, 해외 시장 잠재력 커… 현지화가 성공 열쇠"

      글로벌오토뉴스 25.06.13.
      읽음 50 공감 1
    • 보쉬, SDV 시대 '통합 제어'로 위기 타개… 전동화 차량 승차감 혁신

      글로벌오토뉴스 25.06.13.
      읽음 62 공감 1
    • BMW, 노이에 클라쎄 기반 첫 전기 SUV iX3 9월 공개

      글로벌오토뉴스 25.06.13.
      읽음 59 공감 1
    • 타타자동차, 5년간 41억 달러 투자… 전기차 및 CNG 라인업 확장 박차

      글로벌오토뉴스 25.06.13.
      읽음 57 공감 1
    • 중국 전기차 가격 전쟁 격화… 장청자동차·지리, BYD 배기가스 규제 위반 의혹 제기

      글로벌오토뉴스 25.06.13.
      읽음 53 공감 1
    • 포드, 쾰른 공장서 전기차 배터리팩 자체 생산 돌입… 20억 달러 투자 '미래 공장' 구현

      글로벌오토뉴스 25.06.13.
      읽음 61 공감 1
    • 르노코리아, 개소세 인하 종료 앞두고 신차 계약 40% 증가

      글로벌오토뉴스 25.06.13.
      읽음 52 공감 1
    • [컨슈머인사이트] 'NCAP’ 등급 확인하고 차 산 사람 10명 중 3명뿐

      글로벌오토뉴스 25.06.13.
      읽음 55 공감 1
    • 애스턴마틴, 하이퍼카 '발키리'로 르망 24시 최고 클래스 복귀

      글로벌오토뉴스 25.06.13.
      읽음 66
    • 태안모터스, 아우디 딜러 최초 ISO 45001 전 지점 인증 획득

      글로벌오토뉴스 25.06.13.
      읽음 61
    • 현대차그룹 자율주행 합작사 모셔널, 로라 메이저 CEO 공식 선임

      글로벌오토뉴스 25.06.13.
      읽음 69
    • 루크 동커볼케·피터 슈라이어, 오토모티브 뉴스 100주년 기념상 수상

      글로벌오토뉴스 25.06.13.
      읽음 67
    • 유록스, 트럭커 가족의 삶을 조명한 감동 광고 공개

      글로벌오토뉴스 25.06.13.
      읽음 68
    • 로터스, 축구 국가대표 설영우 선수에 전기 하이퍼 SUV ‘엘레트라’ 후원

      글로벌오토뉴스 25.06.13.
      읽음 64
    • NXP–리막 테크놀로지, SDV용 중앙 집중식 차량 아키텍처 공동 개발

      글로벌오토뉴스 25.06.13.
      읽음 66 공감 1
    • 긱벤치AI로 내PC 들춰보잣!

    • [6.21~] 신세계 상품권 100,000원

    • 상품후기 작성하고 RTX5070 그래픽카드 받자!!

    스폰서 PICK

    이전 페이지 4/5 다음 페이지
    • 엔티스 EG 1000W 80PLUS골드 풀모듈러 ATX3.1 화이트

      엔티스 EG 1000W 80PLUS골드 풀모듈러 ATX3.1 화이트

      엔티스
    • 알파스캔 AOC Q27G4/D 게이밍 FAST IPS 200 QHD HDR 400 멀티스탠드 무결점

      알파스캔 AOC Q27G4/D 게이밍 FAST IPS 200 QHD HDR 400 멀티스탠드 무결점

      알파스캔
    • Antec FLUX PRO MESH(블랙)

      Antec FLUX PRO MESH(블랙)

      Antec
    • 잘만 ALPHA II DS A36(블랙)

      잘만 ALPHA II DS A36(블랙)

      잘만
    • 앱코 KN35BT TKL DRT 8K 염료승화 블루투스 유무선 무접점(서울)

      앱코 KN35BT TKL DRT 8K 염료승화 블루투스 유무선 무접점(서울)

      앱코
    • 1stPlayer Mi5(블랙)

      1stPlayer Mi5(블랙)

      1stPlayer
    • 인텔 코어 울트라7 시리즈2 265K (애로우레이크)(정품)

      인텔 코어 울트라7 시리즈2 265K (애로우레이크)(정품)

      인텔
    • darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash
    • 마이크로닉스 Classic II 풀체인지 700W 80PLUS브론즈 ATX3.1

      마이크로닉스 Classic II 풀체인지 700W 80PLUS브론즈 ATX3.1

      마이크로닉스
    • AMD 라이젠5-6세대 9600X (그래니트 릿지)(멀티팩 정품)

      AMD 라이젠5-6세대 9600X (그래니트 릿지)(멀티팩 정품)

      AMD
    • 잘만
    • 알파스캔 (총 6개월 진행 : 4/8-10/8)
    • 명성(인텔)
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) / 우편번호: 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2004-서울양천-00918호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    뒤로
    새로고침 맨위로 이동
    안내

    유용하고 재미있는 정보인가요? 공감이 된다면 공감 버튼을,
    그렇지 않다면 비공감 버튼을
    눌러 주세요!
    공감이나 비공감을 선택 하는 경우
    다나와 포인트를 적립해 드립니다.
    ※ 공감 버튼의 총 선택 횟수는
    전체 공개입니다.
    비공감 버튼의 선택 여부는
    선택한 본인만 알 수 있습니다.

    포인트 안내
    목록
    공감 1
    비공감
    댓글
    공유

    공유받은 친구가 활동하면 포인트를!

    URL이 복사되었습니다.

    공유하기

    레이어 닫기

    지금 보는 페이지가 마음에 든다면
    공유하기를 통해 지인에게 소개해 주세요.

    • 카카오톡
    • 라인
    • 페이스북
    • X
    • 밴드
    https://dpg.danawa.com/mobile/news/view?boardSeq=60&listSeq=5828921 복사

    로그인 유저에게는 공유 활동에 따라
    다나와 포인트가 지급됩니다.

    자세히 >

    URL이 복사되었습니다.