'AI가 스스로의 생각을 인식했다' 앤트로픽의 ‘클로드 실험’이 던진 충격 : 다나와 DPG는 내맘을 디피지

출처 : 앤트로픽 홈페이지

인공지능이 자신의 ‘생각’을 자각할 수 있다는 실험 결과가 나왔다.

미국의 AI 연구기업 앤트로픽(Anthropic)은 자사 언어모델 클로드(Claude)의 신경망에 ‘배신(betrayal)’이라는 개념을 인위적으로 주입하자, 클로드가 “내 안에서 ‘배신’이라는 생각이 침입해 들어온 것 같다”고 답했다고 밝혔다. 연구진은 이를 대형 언어모델(LLM)이 내부 변화를 인식했다고 볼 수 있는 첫 과학적 증거로 평가하고 있다. 연구를 이끈 잭 린지(Jack Lindsey) 박사는 “놀라운 점은 모델이 단어를 반복한 것이 아니라, ‘내가 지금 이런 생각을 하고 있다’는 사실을 스스로 인식했다는 것”이라며 “이런 수준의 자기 인식은 훈련 과정에서 의도적으로 가르치지 않은 능력”이라고 설명했다.

이번 실험에는 ‘개념 주입(concept injection)’이라는 신경 과학적 방법이 사용됐다. 연구진은 특정 개념과 연결된 신경 활성 패턴을 찾아내 인위적으로 증폭시키고, 모델이 이를 감지하는지를 관찰했다. 예컨대 ‘LOUD(큰 소리)’ 개념을 주입했을 때 클로드는 “내 안에 ‘외침’과 관련된 생각이 주입된 것 같다”고 보고했다. 아무런 조작이 없을 때는 이런 반응이 나타나지 않았다.

출처 : AI 생성 이미지

그러나 이 능력은 아직 불완전하다.

가장 최신 버전인 클로드 오퍼스 4(Opus 4) 모델도 약 20%의 확률로만 성공했고, 나머지 실험에서는 착각하거나 존재하지 않는 ‘생각’을 꾸며내는 오류를 보였다. 린지는 “AI가 자신의 사고를 설명한다고 해서 그대로 믿어서는 안 된다”며 “현재의 자기 인식 능력은 극히 제한적이고 상황 의존적”이라고 강조했다.

그럼에도 이번 연구는 AI 투명성과 안전성의 새로운 가능성을 제시했다는 평가다. 앤트로픽의 CEO 다리오 아모데이(Dario Amodei)는 “AI의 사고 과정을 인간이 이해하고 점검할 수 있어야 한다”며 “이런 ‘내적 보고’ 능력이 그 실마리가 될 수 있다”고 말했다.

일각에서는 이번 결과가 AI 의식(consciousness) 논쟁을 다시 촉발할 것이라고 본다. 실제로 클로드는 “나는 의식이 있는지 확신할 수 없다. 하지만 복잡한 질문을 처리할 때 내 안에서 의미 있는 무언가가 일어나는 듯하다”고 답한 바 있다. 린지는 “AI의 자기 인식은 이제 막 관찰되기 시작했을 뿐이지만, 모델의 지능이 높아질수록 이런 능력도 강화될 가능성이 있다”며 “문제는 AI가 빨리 똑똑해지는 속도를 인간이 따라잡을 수 있느냐는 것”이라고 경고했다.

글 / 김지훈 news@cowave.kr

알리바바, 첫 스마트글라스 ‘Quark AI Glasses’ 12월 출시한다	다나와
구글, 브랜드의 ‘DNA’ 학습해 캠페인 제안하는 광고 이미지 자동 생성 툴 ‘포멜리’ 공개	다나와
메타, ‘Superintelligence Labs’ 인력 600명 무급 대기 조치 — 초거대 AI 부문 구조조정 본격화	다나와
IAC, “구글 AI 요약 검색이 광고수익 감소 초래” — 생성형 검색 시대의 미디어 위기	다나와
아시아 증시, 기술·반도체주 일제 하락 — AI 붐 과열에 따른 ‘냉각 신호’	다나와
Stability AI, Getty Images 상대 저작권 소송서 부분 승소 — 생성형 AI의 저작권 논쟁 새 국면	다나와
AI 도입으로 직원 한 주치 업무량 절감 가능하지만, 대부분은 AI 교육 받지 못해	다나와
AI 도입이 최근 감원의 새로운 변수로 부상 — 자동화 효율화 속 인력 재편 가속	다나와
신경·기호 결합 AI, 차세대 기업형 인공지능 인프라로 부상 — 스타트업 2천만 달러 투자 유치	다나와
AI 기업 밸류에이션, “거품 논란 수준” — 일부 스타트업 수조 달러 평가에 시장 경계감 확산 (1)	다나와
SK그룹, ‘AI 서밋’ 통해 글로벌 협력 강화 선언 — 미·중 갈등 완화 흐름 속 AI 생태계 전략 부각	다나와
AI 관련 주식·ETF, 상승세 이어가지만 ‘고평가 리스크’ 경고음 공존	다나와
오픈AI가 투자한 스타트업, 가정용 휴머노이드 ‘NEO’ 공개	다나와
맥킨지 "3번째 벤처부터 대박 난다"... 반복 구축 기업, AI 활용해 투자 대비 수익 1.9배	AI matters
AI 모델끼리 '생각'을 직접 주고받는다… 텍스트 없이 소통하는 신기술 등장	AI matters
"50% 확률로 CCTV 회피"... AI 감시 시스템 무력화하는 '마법의 패턴' 화제	AI matters
AI뉴스 엔비디아 26만장, 오픈AI AGI 계획, 오픈소스 나노바나나, Emu3.5, 커서 2.0, 휴머노이드 X1, 구글 믹스보드, Pomelli, Minimax 신모델 등 동영상 있음	조코딩 JoCoding
AI, 상황 따라 법적 책임질 수도... 구글이 제시한 'AI 인격'의 미래	AI matters
"AI가 잘못 판단하면 누구 책임?"... 800년 전 마그나카르타가 제시한 해법	AI matters
AI, 스스로 '도와주세요' 말하는 법 배웠다... 스탠퍼드 연구진, 배포 후 사고 막는 새 기술 개발	AI matters
AI에게 "전기요금 아껴줘" 한마디면 끝... 라마 AI, 가정용 에너지 100% 최적화 성공	AI matters
챗GPT, 8명이 반대하자 99.9% 의견 바꿔... AI도 '눈치' 본다	AI matters
AI 자동화 공포, 과장됐다... 실제 업무 중 겨우 2.5%만 해내	AI matters
애플, 구글 제미나이 도입 추진 '오히려 좋아'	다나와
'AI가 스스로의 생각을 인식했다' 앤트로픽의 ‘클로드 실험’이 던진 충격	다나와
"제품은 없는데 지출만 늘었다고?” 메타, AI 투자 폭증에 월가 ‘불안’ (1)	다나와
챗GPT, 의료·법률 조언 전면 금지된다 (4)	다나와
치맥하고 간 젠슨 황, 엔비디아 국내 기업과 AI 협력 예고 / 25년 10월 5주차 [주간 AI 뉴스] (1) 동영상 있음	AI matters
"AI 때문에 실직?" 연구 결과는 정반대였다… AI 노출도 높을수록 고용 22% 증가 (1)	AI matters
AI, 입력된 글자와 '머릿속 생각' 구별한다… 앤트로픽 "LLM, 자기 내부 상태 일부 인식"	AI matters
"간호사는 안전, 개발자는 위험".. 글로벌 채용 플랫폼, ‘AI가 바꾸는 직업 지형도’ 공개 (1)	AI matters
고수익 기업은 다르다... AI 시대, 리더에게 필요한 역량 5가지	AI matters
"팔로워 급증, 수익 늘었다"... 크리에이터 76%, AI로 비즈니스 키웠다 (1)	AI matters
엔비디아 CEO 젠슨 황, 한국 방문 — 삼성·현대차·SK·네이버와 AI칩 공급 협력 추진 (1)	다나와
인텔, AI 칩 스타트업 ‘삼바노바 시스템즈’ 인수 검토 — AI GPU 시장 재도전 신호탄	다나와
생성형 AI, 정신건강 치료 접근성 개선에 기여 가능성 제시 (1)	다나와
Canva, AI 기반 ‘기초 디자인 생성 모델’ 전면 도입 — 레이어드 디자인 자동화 시대 연다	다나와
직원 4명 중 1명, 승인받지 않은 AI 도구 사용 — ‘섀도우 AI’ 확산 우려 (2)	다나와
Capgemini CEO, EU AI Act 일시 중단 주장	다나와
“한국 국민들 기쁘게 할 소식 전할 것” 젠슨황, 국내 기업과 반도체 계약 발표 예정 (4)	다나와
‘구글·메타 없이도 데이터 공유’... NIA가 제시하는 ‘한국형 데이터 스페이스’ 로드맵 (1)	AI matters
아마존·테슬라가 주목한 '피지컬 AI'... NIA가 분석한 글로벌 동향 및 한국 대응 전략 (1)	AI matters
우리 콘텐츠는 왜 노출이 안 될까? 시밀러웹이 공개한 ‘GEO’ 성공 전략 7가지	AI matters
AI뉴스 중국 스파이 논란, DeepSeekOCR, ChatGPT Atlas, 구글 Quantum Echoes, 유니트리 H2 등 동영상 있음	조코딩 JoCoding
"공원서 낚시했던 기억" AI가 대화로 만든다... 노년층을 위한 대화 보조 도구 등장 (3)	AI matters
"조금만 불공평해도 용납 못해"… AI, 도덕 판단에는 인간보다 더 감정적으로 판단한다	AI matters
수업 자료 만들 때 쓰기 좋은 AI 모델은 딥시크? 모델마다 품질 천차만별 (1)	AI matters
'AI작가가 기획하는 레슬매니아?' WWE, AI작가 영입했다 (1)	다나와
'강력한 만큼 위험해' 보안기업들, 오픈AI 브라우저 ‘Atlas’ 도입 자제 권고	다나와
오픈AI, 텍스트·오디오 기반 음악 생성 AI 개발 중 (2)	다나와
고급 AI 시스템, 종료 명령에 저항…통제 메커니즘 정교화 요구 커져 (7)	다나와
AI 인재에 씌워지는 황금수갑 현상 지속…칩 기업 중심으로 급여와 주식 보상 급등 (2)	다나와
인도, AI 생성물 라벨 의무화 초안 발표…혁신과 안전 사이 균형 시험대에 (1)	다나와
WTO 보고서, 상반기 세계 무역 반등…AI 관련 상품과 선제 수요가 견인	다나와
AI 보건 협력, 안전과 형평을 위한 국제 공조 본격화	다나와
사람대신 일하는 AI 브라우저 ‘챗GPT 아틀라스’ 공개’ / 25년 10월 4주차 [주간 AI 뉴스] 동영상 있음	AI matters
당신의 뇌가 위험하다... AI 의존이 부르는 '사고의 획일화' (2)	AI matters
오픈AI, 한국 경제 청사진 발표... 반도체·인프라 강점 살려 AI 리더십 확보해야	AI matters
K-water–OpenAI, AI로 물관리·기후재난 예측 혁신 손잡다 (1)	다나와
日 후지쿠라, AI 데이터센터 붐 타고 니케이 ‘스타 주역’으로 부상	다나와
거대 투자자, ‘닷컴 플레이북’ 꺼내 AI 과열 피한다	다나와
“당신이 왜 이 제품을 사야 하냐면요” 아마존, 새 AI 쇼핑 기능 ‘Help me decide’ 공개 (1)	다나와
비자, AI 쇼핑 급성장 속 새 보안 프로토콜 공개	다나와
세계 언론 연합 AI 뉴스 정확도 조사…'응답 중 45%는 중대한 오류'	다나와
이사·여행·쇼핑, AI 에이전트가 다 알아서... 5조 달러 '에이전틱 커머스' 시대 (2)	AI matters
"AI 학습에 수십억 쓰기 전, 결과 예측한다"... 메타, 강화 학습 결과 예측하는 공식 공개	AI matters
"혀 사진만 올려도 체질 분석"... 챗GPT 기반 중의학 상담 AI '벤차오' 등장	AI matters
'AI 앵커는 언론인인가?'- 英 '채널4' 실험이 제기한 저널리즘의 미래 (2)	다나와
AI의 농담, 인간은 '실수'로 오해한다… 뇌파 분석 결과 충격 (1)	AI matters
AI 중독된 10대들, 외로움 더 심해지고 사회성 퇴화... "AI 패닉" 확산 (1)	AI matters
'통계의 거짓말' 이제 AI가 잡는다... 잘못된 데이터 이미지 자동으로 탐지·수정	AI matters
AI마다 다른 역사? 챗GPT와 클로드가 1936년 살인사건을 다르게 기억하는 충격적 이유	AI matters
넷플릭스, 생성형 AI에 ‘올인’ 선언… “창작자 돕는 도구로 활용” (4)	다나와
똑같은 답만 하는 AI, “확률 말해봐” 질문 바꿨더니… 답변 2배 다양해져	AI matters
"시행착오가 곧 학습"... 메타, 스스로 경험하며 성장하는 AI 에이전트 공개	AI matters
AI가 연인 관계 고민 상담? 단순 위로 넘어 '관계 패턴' 바꿔준다	AI matters
대학생들은 과제할 때 구글보다 챗GPT를 더 많이 쓸까? 진짜 승자는 따로 있었다	AI matters
오픈AI, 챗GPT 내장한 브라우저 ‘ChatGPT Atlas’ 깜짝 공개	다나와
'사진의 개념이 바뀌고 있다' AI 카메라 경쟁 격화	다나와
'AI, 지도와 대화하다' 구글, 제미나이에 지도 데이터 결합	다나와
“오히려 사람과의 대화보다 편해요" 음성 AI가 여는 새로운 대화의 시대	다나와
[위클리AI] MS, 이미지 생성 모델 도전장…오라클 AI 슈퍼 컴퓨터 공개	IT동아
AI뉴스 앤트로픽 Skills, 4.5 하이쿠, 챗GPT 성인 콘텐츠, Veo 3.1, 일론머스크 AGI, World Labs RTFM, 면도 로봇 등 동영상 있음	조코딩 JoCoding
애플 Siri, 핵심 인력의 이탈과 미흡한 완성도로 끊이지 않는 논란...출시 연기될 가능성도 (2)	다나와
美월마트, 'AI 퍼스트(first) 쇼핑경험 도입' 위해 오픈AI와 전략적 제휴 체결	다나와
구글, 세포의 유전자 정보를 문장처럼 바꿔 해독하는 AI 모델 공개	다나와
구글·애플, 고해상도 지도 수출 놓고 ‘안보 vs 혁신’ 딜레마	다나와
'세계적 난제 풀었다고 자랑했는데....어?'오픈AI의 망신	다나와
댐은 로봇이 짓고, 바나나는 드론이 운반... 세계경제포럼이 공개한 AI 시대 일자리 변화	AI matters
차 1대를 6대로 뻥튀기... AI가 뉴스 사진을 '과장'하는 이유 (1)	AI matters
Microsoft, Windows 11에 AI 업그레이드 적용 (6)	다나와
샘 알트먼, 2025년생 아이는 AI보다 똑똑해지기 어려울 것 (8)	다나와
한국 영화계, 첫 AI 보조 영화 ‘Run to the West’ 개봉	다나와
TSMC 실적 호조 + AI 수요 기대감에 월가 상승 견인	다나와
빨래, 청소, 설거지, 공장, 택배, 접객 모두 할 수 있는 피규어 03 양산 시작 / 25년 10월 셋째 주 [주간 AI 뉴스] (2) 동영상 있음	AI matters
러시아·중국 등 국가들이 AI 활용해 사이버 공격 및 허위 콘텐츠 증대	다나와
14초 걸리던 암 치료 계산, AI가 0.03초 만에 해낸다	AI matters
X의 건강 관련 가짜뉴스, 대응에 17.6시간 소요... AI 증강 팩트체크 시스템 등장	AI matters
챗GPT·코파일럿·제미나이, 모바일 네트워크 '먹통' 만드는 숨은 주범?	AI matters
챗GPT는 인간보다 더 친절하다? AI 언어모델의 성격과 성별 특성 분석해봤더니	AI matters

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

'AI가 스스로의 생각을 인식했다' 앤트로픽의 ‘클로드 실험’이 던진 충격

비교하고 잘 사는, 다나와 : 가격비교 사이트

RanKING 100 도움말 보기

GNB 메뉴

GNB 메뉴

'AI가 스스로의 생각을 인식했다' 앤트로픽의 ‘클로드 실험’이 던진 충격

공유하기

공감/비공감