비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

오픈AI, '오퍼레이터’ AI 에이전트 출시 임박... 웹 제어는 인간 능가했지만 PC 제어는 38% 그쳐

2025.01.23. 16:41:50
조회 수
1,705
21
댓글 수
7

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

테크크런치(TechCrunch)가 20일 보도한 내용에 따르면, 오픈AI(OpenAI)가 사용자 PC를 제어하고 다양한 작업을 자동으로 수행할 수 있는 AI 도구를 곧 출시할 것으로 알려졌다.

오픈AI, 1월 중 PC 제어 AI '오퍼레이터' 출시 전망

AI 제품 유출로 유명한 소프트웨어 엔지니어 티보르 블라호(Tibor Blaho)는 오픈AI의 오퍼레이터(Operator) 도구의 존재를 입증하는 증거를 발견했다고 주장했다. 블룸버그(Bloomberg)를 비롯한 여러 매체들은 이전부터 코드 작성과 여행 예약 등을 자율적으로 처리할 수 있는 에이전트 시스템인 오퍼레이터에 대해 보도해왔다.

디인포메이션(The Information)에 따르면 오픈AI는 1월을 오퍼레이터 출시 시점으로 잡았다. 블라호가 발견한 코드는 이러한 보도를 뒷받침한다. 오픈AI의 맥OS용 챗GPT(ChatGPT) 클라이언트에는 '오퍼레이터 전환'과 '오퍼레이터 강제 종료' 단축키 설정 옵션이 숨겨져 있는 것으로 확인됐다.

웹 제어는 인간 능가했지만 비트코인 지갑 생성은 10% 성공률에 그쳐

벤치마크 테스트 결과, 오퍼레이터는 웹사이트 탐색과 상호작용을 평가하는 웹보이저(WebVoyager) 테스트에서 인간의 성능을 뛰어넘었다. 하지만 실제 컴퓨터 환경을 모방한 OSWorld 벤치마크에서는 38.1%의 점수를 기록해 인간의 72.4%에 크게 못 미쳤다. 또 다른 웹 기반 벤치마크인 웹아레나(WebArena)에서도 인간 수준에 미치지 못했다.

유출된 벤치마크에 따르면 오퍼레이터는 인간이 쉽게 수행할 수 있는 작업에서도 어려움을 겪는 것으로 나타났다. 클라우드 서비스 제공업체에 가입하고 가상머신을 실행하는 테스트에서는 60%의 성공률을 보였으며, 비트코인 지갑 생성 작업에서는 10%의 낮은 성공률을 기록했다.

안전성 강화에 주력...안트로픽 에이전트 비판

오픈AI의 공동 창업자 보이테크 자렘바(Wojciech Zaremba)는 최근 X(구 트위터)를 통해 경쟁사 안트로픽(Anthropic)이 안전장치가 부족한 에이전트를 출시했다고 비판했다. "오픈AI가 비슷한 제품을 출시했다면 부정적인 반응이 있었을 것"이라고 그는 지적했다.

유출된 차트에 따르면 오퍼레이터는 '불법 활동'이나 '민감한 개인정보 검색' 등 안전성 평가에서 좋은 성과를 보였다. 이러한 안전성 테스트가 오퍼레이터의 긴 개발 기간의 주요 원인으로 알려졌다. 다만 일부 AI 연구원들과 전직 직원들은 오픈AI가 기술의 빠른 상용화를 위해 안전성 작업을 경시했다고 비판하기도 했다.

AI 에이전트 시장 2030년 471억 달러 전망

시장조사기관 마켓앤마켓(Markets and Markets)에 따르면 AI 에이전트 시장 규모는 2030년까지 471억 달러에 이를 것으로 전망된다. 현재 AI 에이전트 기술은 초기 단계이지만, 안트로픽과 구글(Google)을 비롯한 기술 기업들은 이를 AI 분야의 차세대 혁신으로 평가하고 있다. 전문가들은 AI 에이전트 기술이 급속도로 발전할 경우 안전성에 대한 우려를 제기하고 있다.

해당 기사의 원문은 테크크런치에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT를 활용해 작성되었습니다. 




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 신상품뉴스 전체 둘러보기
1/1
벤틀리, 오직 운전자를 위한 후륜구동 '컨티넨탈 GT 뉴 슈퍼스포츠’ 공개 오토헤럴드
실시간으로 걸레 빨아주는 로봇청소기 등장… 유피 ‘E25 옴니’ 국내 상륙 (2) 뉴스탭
연세유업×해태제과, ‘샌드에이스 우유크림’로 디저트 시장 공략 (2) 뉴스탭
MSI, VA 패널 한계 깬 0.5ms ‘MAG 325QF800 E18V’ 출시… AI·HDR 갖춘 평면 게이밍 끝판왕 (1) 뉴스탭
프로게이머 사양 그대로… ASUS ‘XG27ACMES’ 모니터 한국 상륙 (1) 뉴스탭
케이스티파이 도산 1주년, 한글 감성 담은 ‘도산 한정 한글 컬렉션’ 공개 뉴스탭
올겨울 스타일 끝판왕… 엄브로, 퍼 뒤덮은 ‘스노우 부츠’ 출시 뉴스탭
“4.6m 밖에서도 선명”… 엘가토, 역대급 대형 텔레프롬프터 출시 뉴스탭
아날로그 감성에 무선 편의성까지… 테크닉스 ‘SL-40CBT’ 컴팩트 턴테이블 출시 뉴스탭
밸브 PC 게이밍 환경 확장, 신규 스팀 컨트롤러-머신-VR 헤드셋 발표 (3) 보드나라
[오늘의 스팀] 출시 D-1, 타르코프 판매 시작 (6) 게임메카
페라리, 1050마력 슈퍼 PHEV '849 테스타로사' 국내 최초 공개 (3) 오토헤럴드
알파스캔, 4면 보더리스 AH-IPS 패널 탑재 120Hz 모니터 2종 출시 (2) 다나와
"이번엔 로마시대다!" 유비소프트, '아노 117: 팍스 로마나' 출시 (2) 게임동아
인피니티 미러와 엣지라이팅 품은 다크플래쉬 ‘DF12’ 쿨링팬 국내 출시 (2) 뉴스탭
전면·측면 풀 파노라믹 강화유리 장착한 마이크로닉스 ‘쿨맥스 V6’ 출시 (2) 뉴스탭
앱코, FAST-IPS 평면 34인치 모니터 '하이퍼뷰 34Q165' 출시 (2) 다나와
필립스, QHD 프리미엄 게이밍 모니터 ‘Evnia 27M2N5500P·5500LQ’ 출시 (2) 다나와
맥스엘리트, 실시간 디스플레이 및 일체형 팬 프레임 '1stPlayer TS4 360 ARGB' 쿨러 출시 (2) 다나와
다크플래쉬, 깔끔한 듀얼챔버 'DPF70 ARGB' 어항 케이스 출시 (2) 다나와
이 시간 HOT 댓글!
1/4