요리를 하고 있는 테슬라 옵티머스, 테슬라는 인간의 작업을 1인칭 시점에서 촬영한 영상만으로 로봇에 동작을 학습했다며 영상을 공개했다. (테슬라 공식 X 캡처)
[오토헤럴드 김흥식 기자] 테슬라의 휴머노이드 로봇 ‘옵티머스(Optimus)’가 또 한 번 진화했다. 최근 테슬라가 공개한 시연 영상에서 옵티머스는 집안일, 조립 보조, 요리 보조 등 다양한 작업을 단일 신경망(single neural network)으로 수행하며 로봇 기술의 새로운 이정표를 제시했다.
일론 머스크 테슬라 CEO는 CNBC와의 인터뷰에서 “옵티머스는 장기적으로 테슬라 최대 제품이 될 수 있다”고 밝혔다. 그리고 테슬라 공식 SNS 계정에 역대 가장 인상적인 옵티머스 데모 영상을 공개했다.
영상 속 옵티머스는 쓰레기 버리기, 바닥 쓸기, 진공청소기 사용, 냄비 젓기, 캐비닛 열기·닫기, 커튼 치기 등 일상에서 이뤄질 수 있는 다양한 동작을 자연스럽게 구현한다. 테슬라 차량 부품인 모델 X의 서스펜션 부품(포어 링크)을 들어 운반하는 장면도 포함됐다.
테슬라 옵티머스가 청소를 하고 있는 모습(테슬라 공식 X 캡처)
주목할 점은 이 모든 작업이 하나의 통합된 신경망으로 처리됐다는 사실이다. 기존 로봇들이 각각의 작업에 고유한 명령 체계나 모듈을 요구했던 것과 달리, 테슬라는 인간의 작업을 1인칭 시점에서 촬영한 영상만으로 로봇에 동작을 학습시켰다.
테슬라 옵티머스팀의 부사장 밀란 코박(Milan Kovac)은 “최근 인간 영상으로부터 직접 학습하는 기술적 돌파구를 마련했다”며 “이제는 원격 조작 데이터를 활용하지 않고도 빠르게 새로운 작업을 부트스트랩(초기화)할 수 있다”고 설명했다.
향후에는 3인칭 시점의 랜덤 인터넷 영상에서도 학습이 가능하도록 확장할 예정이며 이를 통해 자기 학습(Self-Play), 강화학습(RL), 시뮬레이션 훈련까지 아우르는 AI 로봇 플랫폼으로 진화한다는 구상이다.
테슬라 옵티머스가 모델 X의 서스펜션 부품(포어 링크)을 들어 운반하는 장면 (테슬라 공식 X 캡처)
현 시점에서 테슬라 옵티머스의 기술적 강점은 다기능성, 학습 속도, 확장성으로 요약된다. 보스턴 다이나믹스의 아틀라스(Atlas)는 기계적 민첩성과 유연성 면에서는 강력하지만, 범용 AI 기반의 작업 이해와 자연 언어 명령 인식에서는 한계를 보여왔다.
반면, 옵티머스는 ‘특정 기능 로봇’을 넘어 “범용 작업 수행 로봇”을 지향하며, 자동차 산업을 포함한 제조, 물류, 의료, 서비스 등 전 산업군에서 인간의 일상적 업무를 대체하거나 보조할 수 있는 잠재력을 갖췄다는 평가다.
전문가들은 옵티머스가 로봇의 정교한 움직임이나 센서 처리 능력 그 자체보다도, ‘인간처럼 배울 수 있는 로봇의 뇌’가 현실화되면서 하드웨어의 혁신이 아닌 소프트웨어 중심의 로봇 혁신이 시작됐다는 점에 주목하고 있다.
김흥식 기자/reporter@autoherald.co.kr
ⓒ 오토헤럴드(http://www.autoherald.co.kr) 무단전재 및 재배포금지