현대자동차그룹의 글로벌 소프트웨어 센터인 포티투닷(42dot)이 사람처럼 자연스러운 대화가 가능한 대규모 언어 모델(LLM) 기반의 차량용 음성 AI 에이전트 ‘글레오 AI(Gleo AI)’ 개발을 완료하고 기술을 21일 공개했다.
글레오 AI는 포티투닷이 지난 2024년 개발에 착수해 이달 현대자동차 ‘더 뉴 그랜저’를 통해 처음 선보인 차량용 음성 AI 에이전트다. 대규모 언어 모델을 기반으로 차량에 동승한 사람과 대화하듯 자연스러운 의사소통이 가능하며, 사용자 요청에 따라 정보를 제공하거나 여러 가지 기능을 직접 제어하는 특징을 지닌다. 발화자의 위치를 인식하고 대화 맥락과 주행 상황 등을 고려해 사용자의 의도를 종합적으로 이해한 뒤, 최적의 에이전트를 선택 및 조합해 기능을 실행하고 자연스러운 응답을 생성한다.
박민우 포티투닷 대표는 글레오 AI가 수고를 덜어주는 이동 동반자로서 앞으로 더 많은 기능을 자연스럽게 수행하고 맥락을 이해하도록 고도화될 것이라고 밝혔다. 아울러 중장기적으로는 사용자 행동과 선호를 이해해 말하지 않아도 필요한 것을 돕는 개인화 AI로 발전시킬 것이라고 덧붙였다.
‘인지-판단-실행’ 전 과정 최적화 및 하이브리드 구조 채택
글레오 AI는 말로 하는 명령만으로 내비게이션 목적지 설정부터 공조 제어, 차량 기능 조작 등 다양한 기능을 차량 내 안전한 환경에서 제어할 수 있도록 돕는다. 탑승객은 별도의 버튼 및 터치 조작 없이도 차량과 상호작용을 하며 편리한 이동 경험을 누리게 된다. 성능과 유연성 확보를 위해 이해, 판단, 답변 생성 등 단계별 목적에 따라 다양한 LLM이 선택적으로 활용되도록 설계됐다.
LLM 인텔리전스, 하이브리드 AI 아키텍처, 스피치 인텔리전스, 글레오 인터페이스 등 기술적 특징을 바탕으로 차량 환경에 특화된 ‘인지-판단-실행’ 전 과정을 유기적으로 수행한다. 특히 저지연성과 안정성이 필수적인 차량 및 시스템 작업은 온디바이스에서 처리하고, 고성능 연산이 필요한 작업은 클라우드에서 수행하는 하이브리드 아키텍처를 채택했다. 최신 LLM 기반의 TTS 기술을 통해 고도로 자연스러운 음성을 생성하며 초저지연 응답 속도를 구현해 끊김 없는 대화를 지원한다. 시스템 앱뿐만 아니라 외부 서드파티 앱도 쉽게 연동하고 확장할 수 있는 생태계를 갖췄다.
맥락 기반 이해와 자체 지식 에이전트로 신뢰성 구축
기존 음성 비서가 정해진 단순 명령어 기반으로만 작동해 불편함이 있었다면, 글레오 AI는 사용자의 발화를 맥락 기반으로 이해하고 의도를 판단하기 때문에 정확한 명령어를 알지 못해도 기능을 수행한다. 이전 대화와 상황까지 연속적으로 이해할 수 있어 편의성이 높다. 단순히 정보를 제공하는 데 그치지 않고 차량 기능과 앱을 직접 제어해 내비게이션, 공조, 미디어, 차량 설정 등 다양한 기능을 하나의 대화 흐름 안에서 수행한다. 발화자의 좌석 위치나 차량 상태에 따라 다른 작업을 수행하는 것도 가능하다.
정확하고 최신의 외부 정보 제공을 위해 지식 에이전트(Knowledge Agent)도 구축했다. 웹 검색과 자체 데이터 컬렉션 등을 기반으로 관련 정보를 실시간으로 탐색하고, 이를 요약 및 재구성해 사전에 학습하지 않은 최신 정보까지 활용해 답변을 제공한다. 자체 개발한 음성 전처리 기술, 언어별 음성 인식, 자연스러운 음성 합성을 내재화해 복합적인 변수가 존재하는 차량 환경에서도 안정적인 음성 품질을 제공하는 구조다.
엄격한 통제가 필수적인 차량 내 데이터 보안을 위해 데이터의 수집부터 저장, 활용까지 전 과정의 거버넌스를 보장한다. 자체 개발한 가드레일 에이전트가 위험 발화를 사전에 감지하며, 법규 위반이나 부적절한 요청은 응답을 제한해 시스템의 신뢰성과 윤리성을 확보했다. 차량 제어 요청은 안전 상황을 확인한 뒤 동작하도록 구조화해 안정성을 높였다. 향후 무선 업데이트(OTA)를 통해 글레오 AI의 기능과 품질을 지속적으로 개선해 나갈 방침이다.
글 / 원선웅 (글로벌오토뉴스 기자)
<저작권자(c) 글로벌오토뉴스(www.global-autonews.com). 무단전재-재배포금지>








