엔비디아(www.nvidia.co.kr)가 영상 검색 및 요약(Video Search and Summarization, VSS)을 위한 AI 블루프린트를 새롭게 공개했다. 이 블루프린트는 자사의 메트로폴리스(NVIDIA Metropolis) 플랫폼을 기반으로 하며, 영상 분석 AI 에이전트 개발의 속도를 높이는 것을 목표로 하고 있다.
현재 전 세계 데이터 트래픽의 절반 이상을 차지하는 영상은 디지털 사회에서 가장 핵심적인 데이터 형태로 자리 잡았다. 특히 영상은 미디어 분야를 넘어 산업 전반에 걸쳐 활용되며 방대한 양이 생성되고 있으나, 분석되는 데이터는 전체의 1%도 채 되지 않는다는 것이 현실이다. 이에 따라, 효율적인 영상 분석 기술의 필요성이 어느 때보다 부각되고 있다.
물리적 산업이 글로벌 GDP의 절반 가까이를 차지하는 가운데, 노동력 부족, 제조업의 온쇼어링, 자동화 수요 증가 등 여러 요인이 복합되며 영상 분석 AI 에이전트의 중요성이 급부상하고 있다. 이러한 배경에서 엔비디아는 개발자와 기업이 고성능 AI 영상 분석 기능을 빠르게 구현할 수 있도록 돕는 VSS 블루프린트를 일반에 공개했다.
VSS 블루프린트는 실시간 영상은 물론 아카이브된 대용량 영상도 신속하게 분석할 수 있도록 설계됐다. 핵심 구성 요소는 비전 언어 모델(Vision Language Model, VLM)과 대형 언어 모델(Large Language Model, LLM) 기술이며, 여기에 검색 증강 생성(RAG, Retrieval-Augmented Generation) 기술을 결합해 기업의 비정형 데이터에 기반한 고차원 분석이 가능하도록 한다.
엔비디아의 NIM 마이크로서비스를 포함한 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼은 영상 시청 대비 100배 빠른 요약 처리 성능을 제공한다. 예를 들어, 1시간 분량의 영상을 1분 내 텍스트 요약이 가능하다. 또한 RTX 6000 PRO, DGX Spark 같은 엣지 플랫폼에서도 활용할 수 있어, 리소스 유연성 또한 높다.
하드웨어 지원도 한층 강화됐다. 단일 A100 또는 H100 GPU 환경에서도 실행할 수 있어, 대규모 클러스터 없이도 AI 에이전트 개발이 가능하다. 수백 개의 영상 스트림과 짧은 클립들을 병렬로 처리할 수 있으며, 음성-텍스트 변환 기능도 포함돼 교육 영상, 회의 기록 등 오디오 기반 콘텐츠의 맥락적 이해까지 확장 가능하다.
VSS 블루프린트는 실제 산업 현장에 빠르게 적용되고 있다. 글로벌 전자제품 제조사 페가트론(Pegatron)은 자사 PEGAAi 플랫폼에 블루프린트를 통합해 작업 공정 분석 및 교육 시스템을 구축했다. 이를 통해 인건비를 7% 절감하고 결함률을 67%까지 낮췄다. 인쇄회로기판 조립 절차와 같은 복잡한 작업 흐름도 영상 AI 에이전트를 통해 실시간 점검할 수 있다.
스마트 시티 사례로는 대만 가오슝시가 주목된다. 파트너사 링커 비전(Linker Vision)은 VSS 기반 AI 애플리케이션을 도입해 재난 대응, 폐기물 관리, 교통 등 12개 시 부서에 실시간 인사이트를 제공 중이다. 특히 실시간 영상 기반 사건 인식 기술을 통해 사고 대응 시간이 최대 80% 단축됐으며, 시내 감시 카메라를 2026년까지 5만 대 이상으로 확대할 계획이다.
북미아이스하키리그(NHL)는 경기 영상 관리를 위한 바스트 인사이트엔진(VAST InsightEngine)을 VSS 블루프린트와 통합해, 경기 하이라이트 및 주요 장면을 1초 이내에 탐색하고 콘텐츠 제작에 활용하고 있다. 향후에는 경기 중 실시간 AI 분석을 통해 전략 분석, 판타지 게임 추천 등 개인 맞춤형 정보를 제공할 계획이다.
산업용 AI 어시스턴트 구축에도 활용되고 있다. 지멘스(Siemens)는 장비 오류 진단, 유지보수 지원 등 작업 현장을 위한 생성형 AI 기반 코파일럿을 VSS 기술로 강화했다. 이 코파일럿은 실시간 데이터와 운영 문서를 통합해 다운타임을 줄이고, 생산성은 최대 30% 이상 향상되는 성과를 보이고 있다.
파트너 생태계에서도 VSS 블루프린트는 빠르게 확산되고 있다. 슈퍼브에이아이(Superb AI)는 인천국제공항에 도입한 프로젝트를 통해 몇 주 만에 승객 대기 시간을 단축했고, 말레이시아 ITMAX는 쿠알라룸푸르시의 스마트시티 시스템을 고도화하고 있다.
광고 분야에서는 파일러(PYLER)가 VSS를 자사 브랜드 안전성 및 광고 타겟팅 솔루션에 통합해, 삼성전자, BYD, 하나금융그룹 등 고객사들이 고효율 광고 집행 성과를 도출하도록 돕고 있다. 특히 BYD는 긍정적인 맥락 콘텐츠 기반 광고를 통해 클릭률이 4배 증가했다.
외식 산업에서도 핑거마크(Fingermark)는 드라이브스루와 같은 실시간 매장 운영 상황을 AI 영상 분석으로 모니터링해, 병목 현상과 사고 대응을 개선하고 있다.
엔비디아는 이번 VSS 블루프린트를 통해 영상 분석 중심의 AI 에이전트 개발을 가속화하고, 다양한 산업에서 현실과 디지털의 연결고리를 확장하고 있다. 영상 데이터의 실시간 분석과 요약이 기존의 수작업 한계를 넘어서며, AI 에이전트 기반 자동화 시대가 본격화되는 흐름을 보여준다.
김종혁 기자/news@newstap.co.kr
ⓒ 뉴스탭(https://www.newstap.co.kr) 무단전재 및 재배포금지
[뉴스탭 인기 기사]
· 걸음 수부터 칼로리까지... 카시오, GPS 스포츠 시계 지샥 GBA-950 공개
· 카시오, 지샥 수집가 위한 전용 디스플레이 세트 선봬
· 카시오, 풀메탈 복각 G-SHOCK ‘GM-B2100SD-1C’ 일본 출시 확정
· MSI, RTX 5080 탑재 고성능 노트북 ‘벡터 16 HX AI’ 포함한 빅스마일데이 특가 행사 진행
· 삼성 갤럭시 워치8, ‘항산화 점수’ 측정 기능 탑재 예상