대다수의 현대적인 차량은 도로 표지판을 인식하고 사고를 예방하는 카메라 시스템을 최소 한 개 이상 탑재하고 있다. 최근에는 고성능 컴퓨터, 정교해진 센서, 인공지능(AI) 기술의 발전에 힘입어 한 단계 진화한 차세대 모빌리티 기술이 도입되는 추세다. 볼보자동차는 올해 개최된 구글 I/O(Google I/O) 행사에서 글로벌 IT 기업 구글과 협력해 구글 기반 인포테인먼트 시스템에 내장된 제미나이(Gemini) AI 비서 기술을 시연했다. 해당 기술은 신형 전기 SUV EX60의 카메라로부터 전방 영상을 직접 받아 실시간으로 해석하고 운전자나 탑승객에게 지식 기반의 답변을 제공하는 동작 방식을 취한다.
양사는 기능의 구체적인 양산 및 대중화 시점에 대해서는 말을 아꼈으나, 미출시 프로젝트임에도 완성도 높은 시각 인지 성능을 보여주었다. 운전자가 음성 명령을 통해 타국어로 작성된 도로 표지판의 의미를 물어보면, 제미나이가 영상을 자동으로 스캔하고 번역해 해당 표지판이 뜻하는 바를 정확히 설명한다.
멀티모달 인식 기반 주변 건축물 인프라 실시간 안내
행사 중 진행된 시연에서는 차량 전방 거리 끝에 보이는 높은 건물에 대한 정보와 주변에서 즐길 수 있는 활동을 묻는 질문이 주어졌다. 제미나이는 즉각 해당 건물이 미국 샌프란시스코의 트랜스아메리카 피라미드(Transamerica Pyramid)임을 인지하고 답변을 출동시켰다. 주로 사무실로 사용되는 건물이라 내부 관광 명소는 아니지만 건물 하단에 공원이 조성되어 있다는 상세 정보를 덧붙였으며, 인근 관심 지역으로의 경로 안내를 자동으로 제안하는 상호작용을 선보였다.
스마트폰에서 활용되는 구글 렌즈(Google Lens) 기능이 제미나이의 거대 언어 모델 및 자연어 음성 명령 체계와 결합되어 모빌리티 환경으로 확장된 결과다. 볼보는 주행 상황과 맥락을 파악하는 공간 인식 AI 경험이 향후 일상적인 운행 과정의 일부로 자리 잡을 것이라고 설명했다. 이러한 기능 구현은 제미나이 모델 고유의 멀티모달(Multi-modal) 이해 능력과 함께 EX60에 탑재된 전용 신경망 처리 장치(NPU), 그리고 소프트웨어 중심 차량(SDV) 아키텍처의 유기적 결합 덕분이다.
데이터 처리 단계 내 프라이버시 최우선 가치 반영
구글은 카메라 연동 AI 비서 기능의 작동 과정에서 탑승객의 프라이버시 보호를 최우선 가치로 처리하고 있다고 밝혔다. 해당 기능은 운전자의 명확한 사전 권한 동의가 있을 때만 활성화되는 구조를 갖췄다. 아울러 내장 프로세서가 전방 카메라 영상을 받아 분석하는 과정에서 보행자의 안면이나 프라이버시 요소가 포착될 경우 화면 상에서 자동으로 블러(Blur) 처리하는 보안 공정을 거치도록 설계되어 시스템의 신뢰성을 높였다.
글 / 원선웅 (글로벌오토뉴스 기자)
<저작권자(c) 글로벌오토뉴스(www.global-autonews.com). 무단전재-재배포금지>








