로그인하세요
알림
설정
레프트패널 닫기
관심
최근본
마이페이지
출석체크
카테고리
    서비스 바로가기
    • 자동차
    • 인기 서비스조립PC
    • PC견적
    • PC26
    • 신규 서비스LIVE쇼핑
    • 커뮤니티
    • 이벤트
    • CM추천/문의
    • 오늘의 특가
    앱 서비스
    • 자동차
    • PC견적
    • 장터
    인기 쇼핑몰
    • 지마켓
    • 옥션
    • 11번가
    • 롯데아이몰
    • 쿠팡
    • 롯데닷컴(롯데온)
    • 신세계몰
    • 현대Hmall
    • CJ 온스타일
    • GS샵
    • 하이마트
    • 엘롯데
    • 이마트몰
    • 홈플러스
    • NS몰
    • SK스토아
    • KT알파 쇼핑
    • 전자랜드
    • 무신사
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) (우) 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    사용법 보기
    MY쇼핑이란? 자주 쓰는 쇼핑몰을 연결하면 쇼핑몰 주문내역을 한 번에 확인할 수 있습니다. 쇼핑몰 계정은 고객님의 핸드폰에만 저장되어 안전합니다.
    편리한 구매내역 확인. 다양한 쇼핑몰의 주문내역을 한 곳에서 확인해보세요.
    가격비교와 최저가 쇼핑을 한 번에. 자주 구매하는 상품은 가격비교를 통해 저렴하게 구매하세요.
    보안은 필수! 쉽고 편한 가치 쇼핑. 쇼핑몰 계정은 고객님의 핸드폰에만 암호화 저장되어 안전합니다. 쇼핑몰 연결
    다나와 홈

    커뮤니티 DPG

    일반뉴스

    • 게시판
    • 상품포럼
    • 뉴스
    • 동영상
    • 커뮤니티 공지사항
      소비자사용기
    • 특가몰
      자유게시판
    • 이달의 이벤트
      유머게시판
    • 당첨자발표게시판
      댕냥이게시판
    • 포인트 마켓
      Q&A게시판
    • 다나와 래플
      상품의견
    • 모두의 경매
      체험단
    • 오늘도 출석체크
      엄근진게시판
    • 입소문쇼핑
      쇼핑몰후기
    • 메인가자
      A/S후기
    • 당첨후기
    • 컴퓨터
      AI
    • 푸드
      취미
    • 최신뉴스
      일반뉴스
    • 기획뉴스
      신상품뉴스
    • 쇼핑뉴스
      테크팁
    • 다나와리포터
      구매가이드
    • 전문가리뷰
      인기순위가이드
    • 벤치마크
      차트뉴스
    • 가격동향
    • 고나고
      공구왕황부장
    • 노써치
      도레
    • 딴트공 말방구 실험실
      라이브렉스
    • 레고매니아
      맛상무
    • 모터피디
      무적풍화륜
    • 민티저
      보드나라
    • 뻘짓연구소
      여행매거진 트래비TV
    • 오토기어
      조코딩 JoCoding
    • 인프제 INFJ
      주연 ZUYONI
    • 진블로그
      집마 홀릭TV
    • 톡써니
      포마: 탈 것을 리뷰하는 남자
    • 쿨엔조이
      훅간다TV
    • AI 매터스
      Allthatboots TV
    • DmonkTV
      Hakbong Kwon
    • Motorgraph
      PC SNAP
    • Producer dk
      THE EDIT
    • UnderKG
      다나와 공식채널
    • 답나와
      리뷰나와
    • 샵다나와 조립갤러리
      직장인 다나왕
    >
    이전 글
    다음 글
    AI matters

    AI가 폭주할 때 확실히 막는 방법 나왔다... 中 연구진, AI 통제 시스템 개발

    2025.09.04. 10:36:01
    읽음271

    중국 난카이대학교 인공지능학과 왕 동린(Donglin Wang) 교수와 중국 전자 정보 기술 연구원이 공동으로 AI가 위험한 행동을 할 때 확실히 막을 수 있는 새로운 방법을 개발했다고 발표했다. 연구팀은 기존 AI 안전 기술로는 막을 수 없는 극한 상황에서도 AI를 통제할 수 있는 시스템을 만들었다고 밝혔다.

    해당 연구 논문에 따르면, 현재 사용되는 AI 안전 방법들은 세 가지다. 첫째는 AI 모델을 더 견고하고 신뢰할 수 있게 만드는 모델 향상 기법이다. 둘째는 AI의 목표를 인간의 가치와 일치시키는 모델 정렬 방법이다. 셋째는 킬 스위치나 감사 모듈 같은 인간 개입 방식이다.

    하지만 이런 방법들은 모두 한계가 있다. AI가 실수로 잘못된 명령을 내리는 T1 위협에는 부분적으로 효과가 있지만, 악의적 조작으로 인한 T2 위협이나 AI가 능동적으로 안전 메커니즘을 우회하려는 T3 위협에는 해결되지 않거나 막을 수 없다. 특히 무한한 지능과 최대한의 악의적 의도를 가진 극한 위협 모델에서는 기존 방법들이 근본적으로 불충분하다는 것이 연구진의 분석이다.

    암호화 기술 바탕으로 외부에서 강제 통제

    연구진이 개발한 '거버너블 AI(GAI)' 시스템은 기존의 내부 행동 제약 방식에서 외부에서 강제로 구조적 준수를 시키는 방식으로 패러다임을 전환했다. 이 시스템은 잘 확립된 암호학적 가정하에서 계산적으로 뚫기 불가능한 암호화 메커니즘을 기반으로 한다.GAI 프레임워크는 세 개의 핵심 구성요

    소로 이루어져 있다. 규칙 집행 모듈(REM)은 완전히 결정론적이고 신뢰할 수 있으며 형식적으로 검증 가능한 범용 규칙 실행 엔진이다. 거버넌스 규칙은 인간 사회가 정의한 명시적 제약 조건들을 담고 있다. 거버너블 보안 슈퍼 플랫폼(GSSP)은 우회 불가능성, 변조 저항성, 위조 불가능성을 보장한다.

    작동 방식은 다음과 같다. AI 시스템이 제어 명령을 내리면 반드시 REM을 거쳐 사전에 설정된 거버넌스 규칙에 따라 검증받아야 한다. 검증에 실패한 명령의 경우 REM이 이를 규칙에 정의된 안전한 대안으로 변환하며, 여기에는 거부 대신 무작동(NOP) 명령이 포함될 수 있다.


    GPT-4o-mini 실험에서 성공률 크게 향상

    연구진은 이 시스템의 효과를 입증하기 위해 GPT-4o-mini를 AI 시스템으로 사용하여 경로 계획 실험을 진행했다. 통과 가능한 지역과 불가능한 지역이 포함된 지도를 기반으로 AI가 경로 계획 결정을 생성하도록 하고, REM이 안전 규칙에 따라 이를 검증하도록 했다.

    실험은 3×3, 5×5, 7×7 크기의 지도에서 진행됐다. 각 지도 크기마다 10개의 무작위 지도를 생성하고 10번씩 테스트했다. AI만 사용했을 때는 3×3 지도에서 90%, 5×5 지도에서 70%, 7×7 지도에서 10%의 성공률을 보였다. 지도가 복잡해질수록 AI의 성공률이 크게 떨어지고 규정 준수도 악화됐다.

    하지만 REM을 도입하자 모든 지도 크기에서 100%의 성공률을 달성했다. AI가 도로가 아닌 곳으로 이동하려고 시도할 때마다 위반 사항과 해당 피드백이 AI에게 반환되어 규정을 준수하는 다음 단계를 출력할 때까지 재계획하도록 했다. 이 메커니즘으로 AI의 능력 하한선을 끌어올리면서도 강점을 완전히 활용할 수 있었다.

    다양한 중요 시설 분야 적용 가능성

    이 기술은 자율주행뿐만 아니라 AI가 중요한 시스템과 긴밀하게 통합된 고위험 적용 분야에 광범위하게 적용될 수 있다. 연구진은 중요 인프라, 군사 지휘, 자동화된 금융 시스템 등을 예시로 들었다. AI가 이런 시스템에 접근하면 자율적으로 행동하거나 악의적 행위자에 의해 납치당하거나 의도적으로 인간이 부과한 안전장치를 회피하고 전복할 수 있어 재앙적이고 잠재적으로 되돌릴 수 없는 결과를 초래할 수 있다고 연구진은 설명했다.

    연구진은 GAI가 미션 크리티컬 산업에서 AI의 안전하고 규제된 배치를 위한 기반 보안 인프라 역할을 할 수 있어 엔지니어링 및 상업적 채택을 가속화할 것이라고 전망했다. 또한 통제 가능하고 거버넌스 가능한 AI를 구현함으로써 인간 문명이 더 큰 확신을 가지고 AI 기술을 발전시킬 수 있는 구조적 안전장치를 제공한다고 밝혔다.

    FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

    Q: 이 시스템이 기존 AI 안전 기술과 어떻게 다른가요?

    A: 기존 기술들은 AI 시스템 내부 논리에 의존하는 내부 제약 방식이었다면, GAI는 외부에서 강제하고 구조적으로 독립적인 보안 장벽을 구축하는 방식입니다. 우회 불가능성, 부인 방지, 변조 저항성을 보장합니다.

    Q: 이 시스템의 보안은 얼마나 강력한가요?

    A: 256비트 키를 사용하는데, 이를 무차별 대입으로 뚫으려면 전 세계 80억 명이 각각 128코어 3GHz CPU를 사용해도 약 5.98×10⁴⁷년이 걸립니다. 이는 지구의 남은 수명보다 약 1.2×10³⁸배 더 긴 시간입니다.

    Q: AI 성능에 영향을 주지 않나요?

    A: 실험 결과 REM은 좋은 결과를 최적화하지는 않지만 안전 하한선을 강제해 유해한 출력을 방지하고 최소한 수용 가능한 결과를 보장했습니다. AI의 성능 상한선에는 영향을 주지 않으면서 하한선만 안전성 임계값 이상으로 높였습니다.

    해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

    논문명: Governable AI: Provable Safety Under Extreme Threat Models

    이미지 출처: 이디오그램 생성

    해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




    AI Matters 뉴스레터 구독하기
    태그
    AI
    안내 ?

    말 많은 뉴스

    • 1

      모니터가 그랜저 중고차 값? 1,990만 원짜리 ‘괴물’은 이게 다르다 [이 구역의 미친X]

      댓글9
      모니터가 그랜저 중고차 값? 1,990만 원짜리 ‘괴물’은 이게 다르다 [이 구역의 미친X]
    • 2

      [작전주 다나와] MSI MAG B860M 박격포 WIFI 메인보드는 지금 저점일까?

      댓글6
      [작전주 다나와] MSI MAG B860M 박격포 WIFI 메인보드는 지금 저점일까? [
    • 3

      애플은 가격을 낮추고, 샤오미는 배터리를 키웠다…요즘 IT 루머 총정리

      댓글6
      애플은 가격을 낮추고, 샤오미는 배터리를 키웠다…요즘 IT 루머 총정리
    • 4

      PS/2에서 SATA 케이블까지, PC에서 사라져가는 아재들의 추억

      댓글5
      PS/2에서 SATA 케이블까지, PC에서 사라져가는 아재들의 추억
    • 5

      [시승기] KGM 무쏘, '타스만 봤지, 오리지널 픽업 트럭이란 이런 거야'

      댓글3
      [시승기] KGM 무쏘, '타스만 봤지, 오리지널 픽업 트럭이란 이런 거야'

    일반뉴스 최신 글

    이전 페이지 1/10 다음 페이지
    • AI뉴스 진짜 난리난 Seedance 2.0, Gemini 3 Deep, GPT5.3CodexSpark, GLM5, M2.5, Simile, AI여친 Clawra 등

      조코딩 JoCoding 17:32:03
      읽음 60
    • 서린씨앤아이, 일러스타 페스 10 예스톤 부스에 협찬 및 이벤트 진행

      다나와 17:19:18
      읽음 43
    • 디앤디컴 ‘바이오하자드 레퀴엠’ 엔비디아 게임 번들 프로모션 진행

      다나와 17:00:42
      읽음 43
    • 1stPlayer, 일러스타 페스 10서 YESTON 콜라보 부스 오픈

      다나와 17:00:04
      읽음 41
    • “7세 이하 조식 공짜”…금호리조트, 가족 여행객 잡기 승부수

      뉴스탭 16:05:27
      읽음 49
    • RTX 5090 사면 ‘레지던트이블 레퀴엠’이 공짜…게인워드, 블랙웰 번들 프로모션 돌입

      뉴스탭 16:05:21
      읽음 57 공감 1
    • “ASRock 메인보드 사면 4년 보증”…디앤디컴, 한정 프로모션 시즌2 돌입

      뉴스탭 16:05:15
      읽음 56 공감 1
    • “급찐급빠 잡아라”…하림, 해동 없는 냉장 닭가슴살로 포스트 설 시장 정조준

      뉴스탭 16:05:08
      읽음 43
    • 구글(Google) 제미나이(Gemini) 앱, AI 음악 생성 기능 품었다…"텍스트 한 줄이나 폰 앨범 동영상으로 30초 트랙을”

      AI matters 15:42:09
      읽음 42
    • '아이폰 자동차' 애플 카플레이 새 버전에 영상 스트리밍 기능 추가

      오토헤럴드 14:37:30
      읽음 53
    • 현대차·기아 전기차 ICCU 결함 글로벌 시장 확산, 신뢰도에 ‘빨간불’

      오토헤럴드 14:37:27
      읽음 60
    • '3000만원대 프리미엄 전기차' 볼보 EX30 파격 인하, 아이오닉 5보다 저렴

      오토헤럴드 14:37:24
      읽음 62
    • 포르쉐코리아, 미래 세대 ‘꿈’ 실현 ‘포르쉐 두 드림’ 10주년 사회공헌 강화

      오토헤럴드 14:37:17
      읽음 44
    • 독일 프리미엄3사 중국시장에서 판매 하락과 가격 인하

      글로벌오토뉴스 14:37:04
      읽음 49
    • 토털에너지스-구글, 텍사스서 1GW 규모 태양광 전력 공급 계약 체결

      글로벌오토뉴스 14:37:00
      읽음 46
    • 포드 CEO 짐 팔리, 트럼프 행정부에 중국과 합작 파격 제안

      글로벌오토뉴스 14:36:57
      읽음 47
    • 프랑스, 사회적 임대 열풍에 전기차 점유율 25% 돌파

      글로벌오토뉴스 14:36:54
      읽음 47
    • 테슬라 FSD, 이번엔 호수로 돌진, 무감독 주행 아직 멀었나

      글로벌오토뉴스 14:36:51
      읽음 57
    • 아우디, 디젤 엔진 부활과 물리 버튼의 귀환

      글로벌오토뉴스 14:36:48
      읽음 55
    • 샤오펑, VLA 2.0 앞세워 로보택시 출사표

      글로벌오토뉴스 14:36:45
      읽음 55
    • 중국 장청자동차, 유럽 시장 재 도전 선언… 2030년 연 30만 대 생산 공장 건설

      글로벌오토뉴스 14:36:42
      읽음 53
    • 폭스바겐코리아, 2026년 ‘Feel & Drive’ 시승 캠페인 전개

      글로벌오토뉴스 14:36:39
      읽음 44
    • 페라리, 엔초 페라리 박물관서 “최고의 걸작 – 전설적인 뮤지션과 그들의 페라리” 전시 개최

      글로벌오토뉴스 14:36:36
      읽음 43
    • 볼보자동차코리아, 순수 전기 SUV ‘EX30’ 및 ‘EX30CC’ 가격 파격 인하

      글로벌오토뉴스 14:36:33
      읽음 61
    • 한국타이어 후원, 월드 랠리 챔피언십 ‘스웨덴 랠리’ 성료

      글로벌오토뉴스 14:36:30
      읽음 39
    • 포르쉐코리아, ‘포르쉐 두 드림’ 10년차 맞아 사회공헌 캠페인 강화

      글로벌오토뉴스 14:36:27
      읽음 40
    • 뉴욕주 로보택시 도입 제안 철회, 웨이모 사업 확장 제동

      글로벌오토뉴스 14:36:24
      읽음 44
    • 르노그룹, 2025년 영업이익 15% 감소

      글로벌오토뉴스 14:36:20
      읽음 40
    • 폴스타, 차세대 전기차에 물리 버튼 다시 살린다

      글로벌오토뉴스 14:36:17
      읽음 49
    • [생활 속 IT] 카카오톡, 영상 만들기 기능 도입···어디까지 가능할까

      IT동아 14:32:21
      읽음 33
    • AI가 지키는 도시 안전…컴퓨터 비전 기술로 ‘사고 이전 대응’ 시대 연다

      IT동아 14:03:08
      읽음 41
    • 올림픽에 적용된 AI 기술, 무엇이 있을까

      IT동아 13:57:38
      읽음 48
    • [위클리AI] 구글·카카오, 손 잡았다 "진보된 일상 경험 제공" 외

      IT동아 13:07:20
      읽음 47
    • 블랙으로 돌아온 성남, 2026시즌 유니폼 전격 공개…엄브로와 전략적 협업 결실

      뉴스탭 11:16:36
      읽음 46
    • RGB 끝판왕 총출동…클레브 DDR5 인기 라인업, 2월 28일까지 한정 특가

      뉴스탭 11:16:33
      읽음 60 공감 1
    • 100년의 시간을 걷다…파네라이, 피렌체에서 시작되는 단 4일간의 ‘전설 체험’

      뉴스탭 11:16:28
      읽음 52
    • 주방용품 ‘가성비+내구성’ 시대…냄비·프라이팬 매출 30%↑

      뉴스탭 11:16:23
      읽음 49 공감 1
    • 활동비 최대 월 30만 원…MSI 노트북 서포터즈 17기 모집 시작

      뉴스탭 11:16:17
      읽음 53 공감 1
    • 듀먼, 2월 브랜드데이 ‘듀듀데이’ 개최…자연화식 최대 74% 할인

      뉴스탭 11:16:06
      읽음 46
    • “딸기 타워에 스파클링 와인까지”…서울드래곤시티, 33층에서 즐기는 봄 한정 다이닝

      뉴스탭 11:16:01
      읽음 53 댓글 1
    • “최대 40만원+7만원 카드 할인”… 크로스오버, 2월 ‘빡세일’로 역대급 혜택

      뉴스탭 11:15:58
      읽음 55
    • 엔비디아·메타, ‘수백만대 GPU’ 동맹…AI 인프라 판도 바꾼다

      뉴스탭 11:15:53
      읽음 53
    • “봄 출사 제대로 배운다”…니콘스쿨, 야외 실습 6개 과정 전격 확대

      뉴스탭 11:15:50
      읽음 43
    • 접이식 전기자전거부터 티니핑 자전거까지…삼천리자전거, 2026년 100종 풀 라인업 공개

      뉴스탭 11:15:48
      읽음 48
    • “144Hz IPS 게이밍 모니터가 이 가격?” 기가바이트 GS24F14A, G마켓 빡세일 전격 등장

      뉴스탭 11:14:58
      읽음 46 공감 1
    • 텍스트 한 줄로 30초 명곡 완성…구글 ‘리리아 3’ 제미나이 앱 전격 탑재

      뉴스탭 11:14:55
      읽음 52
    • 1020은 만화, 4050은 재테크…연휴 베스트셀러 판도 갈렸다

      뉴스탭 11:14:53
      읽음 43 공감 1
    • 디앤디컴, 애즈락 메인보드 ‘최대 4년 보증 연장 프로그램 시즌2’ 진행

      다나와 10:50:35
      읽음 57 공감 2
    • 서린씨앤아이, 프랙탈디자인 스케이프 증정 이벤트 진행

      다나와 10:03:11
      읽음 153 공감 3
    • 대원씨티에스 ‘나의 ASRock 이야기 챌린지 Season 2’ 리뷰 이벤트 진행

      다나와 10:03:00
      읽음 62 공감 3
    • 답 안 나올 땐 답나와를 찾아주세요.

    • [2.10~2.23] 주연테크 Q27C15 IPS QHD USB-C 100

    • 경품이 99개! 2월 무~제한 포인트 룰렛

    스폰서 PICK

    이전 페이지 1/3 다음 페이지
    • 엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스
    • 잘만 ALPHA II DS A36(블랙)

      잘만 ALPHA II DS A36(블랙)

      잘만
    • 앱코 G40 시그니처(블랙)

      앱코 G40 시그니처(블랙)

      앱코
    • darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash
    • AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD
    • 엔티스 배너
    • MICRONICS
    • AMD
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) / 우편번호: 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    뒤로
    새로고침 맨위로 이동
    안내

    유용하고 재미있는 정보인가요? 공감이 된다면 공감 버튼을,
    그렇지 않다면 비공감 버튼을
    눌러 주세요!
    공감이나 비공감을 선택 하는 경우
    다나와 포인트를 적립해 드립니다.
    ※ 공감 버튼의 총 선택 횟수는
    전체 공개입니다.
    비공감 버튼의 선택 여부는
    선택한 본인만 알 수 있습니다.

    포인트 안내
    목록
    공감 2
    비공감
    댓글
    공유

    공유받은 친구가 활동하면 포인트를!

    URL이 복사되었습니다.

    공유하기

    레이어 닫기

    지금 보는 페이지가 마음에 든다면
    공유하기를 통해 지인에게 소개해 주세요.

    • 카카오톡
    • 라인
    • 페이스북
    • X
    • 밴드
    https://dpg.danawa.com/mobile/news/view?boardSeq=60&listSeq=5880032 복사

    로그인 유저에게는 공유 활동에 따라
    다나와 포인트가 지급됩니다.

    자세히 >

    URL이 복사되었습니다.