토요타자동차의 소프트웨어 전문 자회사 우븐 바이 토요타가 자율주행 인공지능의 대규모 데이터 처리 및 지속 가능한 성능 향상을 구현하는 고도화된 소프트웨어 개발 플랫폼을 공개했다. 미국과 중국 시장을 중심으로 엔드투엔드 기반의 AI 자율주행 기술이 급격히 확산되는 가운데, 토요타는 글로벌 시장에 보급된 막대한 양산차 플릿을 데이터 수집 원천으로 활용해 개발 사이클을 획기적으로 단축한다는 전략이다.
우븐 바이 토요타가 명명한 자율주행 AI 개발 환경의 핵심은 액티브 러닝 루프(Active Learning Loop)다. 이 아키텍처는 데이터 수집, 이슈 우선순위 지정, 데이터셋 생성, AI 모델 학습, 시뮬레이션 평가, 차량 평가, 시장 출시 및 판정 등 총 7단계의 순환 구조로 설계됐다. 소프트웨어가 7단계 승인을 거쳐 무선 업데이트 형식으로 고객 차량에 배포되면, 개선된 시스템을 탑재한 차량들이 다시 1단계인 데이터 수집 프로세스로 진입해 성능을 다듬는 연속적 진화 체계를 갖췄다.
1단계 데이터 수집은 자체 운영하는 전문 테스트 차량과 사전 동의를 거친 일반 고객 소유 차량의 투트랙으로 진행된다. 테스트 차량은 고해상도 센서가 포착한 가공되지 않은 정밀 원천 데이터를 내장 하드디스크 드라이브에 통째로 기록한다. 반면, 고객 차량은 주행 중 갑작스러운 제동, 급격한 조향, 차체 미끄러짐 등 ADAS에 이상 신호가 감지된 전후 수 초간의 핵심 데이터만을 선별해 셀룰러 통신망으로 클라우드에 전송한다.
수집된 데이터에서 특정 하드웨어나 소프트웨어의 한계를 도출하는 2단계 과제 우선순위 지정을 지나면 3단계 데이터셋 생성으로 이어진다. 예를 들어 카메라가 도로 위 특정 동물을 인지하지 못해 급제동이 발생한 이슈가 접수되면, AI 모델을 추가 학습시키기 위해 수집된 방대한 영상 중에서 유사한 동물 이미지를 추출하는 과정이다.
우븐 바이 토요타는 이 과정에서 수작업의 한계를 극복하기 위해 오픈소스 멀티모달 AI 모델인 BLIP를 커스텀 빌드한 자체 시각-언어 검색 시스템을 도입했다. 엔지니어가 시스템에 도로 위의 동물과 같은 텍스트 키워드를 입력하면 수 페타바이트(PB)급 데이터 속에서 관련 주행 영상이 즉각 필터링되며, 일부 오인식된 데이터만 수동으로 제외해 데이터 레이블링 효율성을 극대화했다.
이렇게 정제된 데이터셋은 오픈소스 모델을 기반으로 최적화된 4단계 AI 모델 학습을 거쳐 성능이 고도화된다. 이후 진행되는 5단계 시뮬레이션 평가는 실제 도로 검증에 소요되는 시간과 비용을 파격적으로 절감하는 핵심 단계다.
가상 환경 내에서 주행 시나리오의 3D 비디오 데이터를 변형 및 재구성할 수 있어, 왼쪽 차선에서 수집된 주행 데이터를 가상으로 오른쪽 차선으로 옮겨 안전성을 평가하거나, 일본 도로 데이터 위에 미국 뉴욕의 옐로우캡 택시 이미지를 합성해 특이 개체(Edge Case) 인식률을 사전에 검증할 수 있다.
마지막으로 가상 시뮬레이션을 통과한 소프트웨어는 6단계 실제 시험 차량 검증 단계로 넘어가 폐쇄형 시험 코스에서 최종 안전성이 확인되며, 최종 승인이 떨어지면 7단계 릴리스 판정을 통해 시장에 공급된다. 토요타의 강점인 글로벌 양산 규모가 우븐 바이 토요타의 AI 비전 엔진 및 아린.OS 생태계와 결합하면서, 엣지 케이스 대응 능력이 필수적인 고단계 자율주행 시장에서 강력한 데이터 주도권을 확보하게 될 것으로 전망되고 있다.
<저작권자(c) 글로벌오토뉴스(www.global-autonews.com). 무단전재-재배포금지>








