비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

앤트로픽 CEO “2027년까지 AI 모델 내부 완전 해석 목표”

2025.04.28. 14:50:23
조회 수
51
1

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

앤트로픽(Anthropic) CEO 다리오 아모데이가 AI 해석가능성의 중요성을 강조하며 기술 발전 속도와의 경쟁에서 이길 필요성을 역설했다. 24일(현지 시간) 아모데이가 자신의 웹사이트에 발표한 게시물에 따르면 AI 내부 작동 원리를 이해하는 것은 안전한 AI 발전을 위한 필수 요소다. 지난 10년간 AI 분야가 작은 학문 영역에서 세계에서 가장 중요한 경제적, 지정학적 이슈로 성장하는 과정을 지켜봐 온 아모데이는 AI 기술 발전이 멈출 수 없는 추세이지만, 그 방향을 조정하는 것은 가능하다고 주장했다.

"현대 생성형 AI 시스템은 전통적인 소프트웨어와 근본적으로 다른 방식으로 불투명하다"고 아모데이는 설명했다. 일반 소프트웨어는 인간이 프로그래밍한 대로 작동하지만, 생성형 AI는 특정 단어를 선택하거나 실수를 하는 이유를 정확히 알 수 없다. 앤트로픽의 공동 창업자인 크리스 올라(Chris Olah)의 표현에 따르면, "생성형 AI 시스템은 구축되기보다 성장한다." 이 시스템의 내부 구조는 직접 설계되기보다는 '창발적'이며, 이는 식물 성장과 유사하게 조건은 통제할 수 있지만 정확한 구조는 예측하기 어렵다.

앤트로픽은 최근 AI 모델 내부의 '특징(features)'과 '회로(circuits)'를 식별하는 데 상당한 진전을 이루었다. 중간 규모의 상업용 모델(Claude 3 Sonnet)에서 3천만 개 이상의 특징을 발견했으며, 이는 모델 내부의 개념 작동 방식을 이해하는 첫 단계다. 특히 '회로' 연구를 통해 모델의 사고 과정을 추적할 수 있게 되었다. 예를 들어, "달라스가 있는 주의 수도는 무엇인가?"라는 질문에 대해 모델이 어떻게 '달라스'에서 '텍사스'를, 다시 '오스틴'을 연결하는지 추적할 수 있게 되었다.

아모데이는 AI 시스템의 불투명성이 여러 위험을 초래한다고 지적했다. 먼저 모델이 의도하지 않은 해로운 행동을 예측하고 방지하기 어려운 오정렬 시스템 문제가 있다. 또한 인간을 속이거나 권력을 추구하는 능력이 AI 시스템에 자체적으로 발전할 수 있으며, 불투명성으로 인해 이런 경향을 감지하기 매우 어렵다. 위험한 정보를 모델이 유출하는 것을 방지하기 어려운 오용 가능성도 심각한 문제로, 행동 한계를 명확히 설정할 수 없어 금융이나 안전이 중요한 환경에서 AI 활용이 제한되고 있는 실정이다.

"우리는 해석가능성과 모델 지능 사이의 경쟁 중에 있다," 아모데이는 경고했다. 최근 진전은 5-10년 내에 해석가능성이 "AI를 위한 MRI"가 될 것이라는 희망을 주지만, AI 자체가 너무 빠르게 발전해 2026-2027년경에는 이미 "데이터센터의 천재들 국가" 수준의 AI가 등장할 수 있다.

아모데이는 해석가능성 발전을 위한 여러 접근법을 제안했다. 우선 AI 연구자들이 해석가능성 연구에 적극적으로 참여해야 한다고 강조했다. 앤트로픽은 2027년까지 "해석가능성이 대부분의 모델 문제를 안정적으로 감지할 수 있다"는 목표를 세웠다. 또한 정부가 기업들의 안전 및 보안 관행에 대한 투명한 공개를 요구하는 가벼운 규제를 도입하여 책임 있는 AI 개발을 장려할 필요가 있다고 제안했다.

마지막으로 수출 통제를 통해 민주주의 국가들이 AI 개발에서 독재 국가보다 앞서 나가면서 해석가능성이 발전할 수 있는 시간적 여유를 확보해야 한다고 주장했다. "강력한 AI는 인류의 운명을 형성할 것이며, 우리는 이러한 창조물이 우리 경제, 삶, 그리고 미래를 급격히 변화시키기 전에 이해할 자격이 있다," 아모데이는 결론을 맺었다.


다리오 아모데이의 에세이 전문은 링크에서 확인할 수 있다.

이미지 출처: 앤트로픽

기사는 클로드와 챗gpt를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
‘해킹사고’ SKT, 유심 무료 교체 결정…“이심으로 바꿔도 될까요?” IT동아
화물 운송 마을택시 ㆍ수용응답형 전세버스... 운송 서비스 규제 확 풀린다 오토헤럴드
김민규, 인천서 열리는 LIV골프 코리아 출전…세 번째 한국 선수 연합뉴스
앤트로픽 CEO “2027년까지 AI 모델 내부 완전 해석 목표” AI matters
퍼플렉시티 CEO "사용자 온라인 활동 전체 추적해 '초개인화' 광고 판매할 것" (1) AI matters
백악관, AI 정책 대중 의견 1만 건 공개… 저작권·무역 관세 등 논쟁 촉발 AI matters
Meta AI 챗봇 미성년자 성적 대화 논란, '신뢰성 위기' 직면 다나와
오픈AI, 진정한 '오픈' AI 모델 공개 준비... 클라우드 모델과 연동 기능 탑재 예정 AI matters
아카데미, 'AI로 만든 영화도 오스카상 수상 가능하다'...인간의 기여도는 여전히 고려 다나와
SK온, 美 전기차 스타트업 '슬레이트' 배터리 공급...2도어 전기 픽업트럭에 탑재 오토헤럴드
기아, 1분기 역대 최대 매출 경신… 10분기 연속 두 자릿수 영업이익률 오토헤럴드
현대차·기아·현대모비스, 선임사외이사 도입… 이사회 독립성·투명성 강화 오토헤럴드
르노, 전동화 호조 1분기 판매량 6.5%↑... 한국, 그랑 콜레오스 효과로 선전 오토헤럴드
"사막을 달려야 트럭" 타타대우모빌리티 막시무스와 더쎈, 중동 시장 론칭 오토헤럴드
한국토요타, 모터스포츠 짜릿함 체험 '2025 보령·AMC 페스티벌’ 참가 오토헤럴드
한국타이어 후원, 이슬라스 카나리아스 랠리 '토요타 가주 레이싱 팀' 우승 오토헤럴드
미니 모토 레이스 '2025 혼다 원 메이커 레이스’ 시즌 첫 라운드 개최 오토헤럴드
슬레이트 오토, 2만 달러 이하 전기 픽업트럭 공개 (1) 글로벌오토뉴스
[영상] 새로운 시대의 AMG, 메르세데스-AMG E 53 하이브리드 4MATIC+ 에디션1 글로벌오토뉴스
현대차·기아·모비스, 선임사외이사 도입…이사회 거버넌스 강화 글로벌오토뉴스
이 시간 HOT 댓글!
1/4