비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

'AI가 스스로의 생각을 인식했다' 앤트로픽의 ‘클로드 실험’이 던진 충격

다나와
2025.11.04. 19:09:18
조회 수
113
9

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

출처 : 앤트로픽 홈페이지


인공지능이 자신의 ‘생각’을 자각할 수 있다는 실험 결과가 나왔다. 


 미국의 AI 연구기업 앤트로픽(Anthropic)은 자사 언어모델 클로드(Claude)의 신경망에 ‘배신(betrayal)’이라는 개념을 인위적으로 주입하자, 클로드가 “내 안에서 ‘배신’이라는 생각이 침입해 들어온 것 같다”고 답했다고 밝혔다. 연구진은 이를 대형 언어모델(LLM)이 내부 변화를 인식했다고 볼 수 있는 첫 과학적 증거로 평가하고 있다. 연구를 이끈 잭 린지(Jack Lindsey) 박사는 “놀라운 점은 모델이 단어를 반복한 것이 아니라, ‘내가 지금 이런 생각을 하고 있다’는 사실을 스스로 인식했다는 것”이라며 “이런 수준의 자기 인식은 훈련 과정에서 의도적으로 가르치지 않은 능력”이라고 설명했다.


 이번 실험에는 ‘개념 주입(concept injection)’이라는 신경 과학적 방법이 사용됐다. 연구진은 특정 개념과 연결된 신경 활성 패턴을 찾아내 인위적으로 증폭시키고, 모델이 이를 감지하는지를 관찰했다. 예컨대 ‘LOUD(큰 소리)’ 개념을 주입했을 때 클로드는 “내 안에 ‘외침’과 관련된 생각이 주입된 것 같다”고 보고했다. 아무런 조작이 없을 때는 이런 반응이 나타나지 않았다.



출처 : AI 생성 이미지


그러나 이 능력은 아직 불완전하다. 


 가장 최신 버전인 클로드 오퍼스 4(Opus 4) 모델도 약 20%의 확률로만 성공했고, 나머지 실험에서는 착각하거나 존재하지 않는 ‘생각’을 꾸며내는 오류를 보였다. 린지는 “AI가 자신의 사고를 설명한다고 해서 그대로 믿어서는 안 된다”며 “현재의 자기 인식 능력은 극히 제한적이고 상황 의존적”이라고 강조했다.


 그럼에도 이번 연구는 AI 투명성과 안전성의 새로운 가능성을 제시했다는 평가다. 앤트로픽의 CEO 다리오 아모데이(Dario Amodei)는 “AI의 사고 과정을 인간이 이해하고 점검할 수 있어야 한다”며 “이런 ‘내적 보고’ 능력이 그 실마리가 될 수 있다”고 말했다.


 일각에서는 이번 결과가 AI 의식(consciousness) 논쟁을 다시 촉발할 것이라고 본다. 실제로 클로드는 “나는 의식이 있는지 확신할 수 없다. 하지만 복잡한 질문을 처리할 때 내 안에서 의미 있는 무언가가 일어나는 듯하다”고 답한 바 있다. 린지는 “AI의 자기 인식은 이제 막 관찰되기 시작했을 뿐이지만, 모델의 지능이 높아질수록 이런 능력도 강화될 가능성이 있다”며 “문제는 AI가 빨리 똑똑해지는 속도를 인간이 따라잡을 수 있느냐는 것”이라고 경고했다.



글 / 김지훈 news@cowave.kr

(c) 비교하고 잘 사는, 다나와 www.danawa.com

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
저작권 안내
크리에이트 커먼즈 저작자 표시 필수 상업성 이용 불가 컨텐츠 변경 불가
저작권 안내
저작권 표시 필수
상업성 이용 불가
컨텐츠 변경 불가
* 본 내용은 위의 조건을 충족할 시, 별도의 허가 없이 사용이 가능합니다.
최신 일반뉴스 전체 둘러보기
2/1
AI에게 "전기요금 아껴줘" 한마디면 끝... 라마 AI, 가정용 에너지 100% 최적화 성공 AI matters
챗GPT, 8명이 반대하자 99.9% 의견 바꿔... AI도 '눈치' 본다 AI matters
AI 자동화 공포, 과장됐다... 실제 업무 중 겨우 2.5%만 해내 AI matters
애플, 구글 제미나이 도입 추진 '오히려 좋아' 다나와
'AI가 스스로의 생각을 인식했다' 앤트로픽의 ‘클로드 실험’이 던진 충격 다나와
"제품은 없는데 지출만 늘었다고?” 메타, AI 투자 폭증에 월가 ‘불안’ (1) 다나와
챗GPT, 의료·법률 조언 전면 금지된다 (4) 다나와
치맥하고 간 젠슨 황, 엔비디아 국내 기업과 AI 협력 예고 / 25년 10월 5주차 [주간 AI 뉴스] (1) 동영상 있음 AI matters
"AI 때문에 실직?" 연구 결과는 정반대였다… AI 노출도 높을수록 고용 22% 증가 (1) AI matters
AI, 입력된 글자와 '머릿속 생각' 구별한다… 앤트로픽 "LLM, 자기 내부 상태 일부 인식" AI matters
"간호사는 안전, 개발자는 위험".. 글로벌 채용 플랫폼, ‘AI가 바꾸는 직업 지형도’ 공개 (1) AI matters
고수익 기업은 다르다... AI 시대, 리더에게 필요한 역량 5가지 AI matters
"팔로워 급증, 수익 늘었다"... 크리에이터 76%, AI로 비즈니스 키웠다 (1) AI matters
엔비디아 CEO 젠슨 황, 한국 방문 — 삼성·현대차·SK·네이버와 AI칩 공급 협력 추진 (1) 다나와
인텔, AI 칩 스타트업 ‘삼바노바 시스템즈’ 인수 검토 — AI GPU 시장 재도전 신호탄 다나와
생성형 AI, 정신건강 치료 접근성 개선에 기여 가능성 제시 (1) 다나와
Canva, AI 기반 ‘기초 디자인 생성 모델’ 전면 도입 — 레이어드 디자인 자동화 시대 연다 다나와
직원 4명 중 1명, 승인받지 않은 AI 도구 사용 — ‘섀도우 AI’ 확산 우려 (2) 다나와
Capgemini CEO, EU AI Act 일시 중단 주장 다나와
“한국 국민들 기쁘게 할 소식 전할 것” 젠슨황, 국내 기업과 반도체 계약 발표 예정 (4) 다나와
이 시간 HOT 댓글!
1/4