지난 4월 21일부터 22일까지 마포에 위치한 디캠프에서 엔비디아에서 최초로 주체한 "엔비디아 네모트론 디벨로퍼 데이즈 서울 2026" 이 진행이 되었다. 이 행사에서는 국내 AI 디벨로퍼와 연구자 및 AI 코딩에 관련이 많은 일반인들까지 포함하여 500여 명이 넘는 인원이 참여하여 성공리에 마감하였다. 이날은 엔비디아 DGX 기반의 시스템을 설명하며 기가바이트, 에이수스에서 출시한 AI 슈퍼 컴퓨터 들이 전시 및 시연하여 많은 개발자의 관심을 받았다. 그리고 행사를 기념해 오프라인 행사장에서 할인된 가격으로 구입까지 할 수 있어서 더욱더 인기가 좋았다.
엔비디아의 네모트론은 로컬 LLM 를 돌리기 위한 풀-스텍 소프트웨어로 기본적으로 우분투 기반의 운영체제 하에서 작동된다. 공개된 다양한 에이전트를 실행 시킬 수 있는데 싱글 혹은 리소스가 허용하는 범위 내에서 여러 개의 에이전트를 실행시킬 수도 있다. 엔비디가 강력하게 밀고 있는 오픈 소스 기반이어서 이 에이전트가 생성하는 토큰에 대한 비용도 지불할 필요가 없기 때문에 소규모 AI 개발자 혹은 로컬에서 다양한 에이전트를 사용해보고 싶은 분들에게는 좋은 선택이다. 엔비디아에서는 이 네모트론은 자사의 NVIDIA RTX PRO 및 NVIDIA DGX Spark™ 를 통해 사용할 수 있으며 에이젠트 제작 후에는 빠르게 배포할 수 있는 환경도 제공한다.

▲ 엔비디아의 정구형 솔루션 키텍트 팀장이 전반적인 DGX, 네모트론에 대한 기본적인 설명 및 시연을 보여주었다.



▲ 엔비디아 DGX 스파크 의 클론 모델인 기가바이트 AI TOP ATOM 의 전시 및 시연 등을 기가바이트 엔비디아 직원들에게서 진행되었다.

▲ 엔비디아 DGX 스파크 의 클론 모델인 ASUS Ascent GX10 모습


▲ 간략 스펙 : 아키텍처: NVIDIA Grace Blackwell (GB100) 슈퍼칩, AI 성능: 최대 1 PFLOPS (FP4), 메모리: 128GB LPDDR5x 통합 메모리 (273 GB/s), 스토리지: 4TB NVMe M.2 (자체 암호화) - 옵션으로 스토리지 용량 선택 가능, 네트워크: 2x 200G ConnectX-7 SmartNIC, 10GbE, Wi-Fi 7, 크기/무게: 150 x 150 x 50.5 mm / 1.2 kg , 소프트웨어: NVIDIA DGX OS(Ubuntu Linux 기반) 사전 설치, 초고속 AI 처리: FP4/FP6/FP8/FP16 등 다양한 데이터 포맷을 지원하여 생성형 AI 추론 및 파인튜닝에 최적화, 확장성: 2대를 연결하여 최대 400B 파라미터 모델까지 처리 가능
추가적인 부대 행사로 엔비디아 주체로 네모트론 해커톤 행사가 이루어졌는데 21일 부터 22일까지 이틀 동안의 시간으로 실제 엔비디아 DGX 스파크를 활용하여 AI 에이전트를 활용하여 다양한 앱 및 데이터 분석 그리고 실제 사용가능한 앱의 데모 등을 보어주어 엔비디아 직원들의 평가가 이루어졌다.

▲ 네모트론 해커톤에 참여한 약 20여개의 팀은 엔비디아 직원들의 심사 및 프리젠테이션 진행 후에 이어지는 질의문답 등을 통해 많은 박수를 받았다.
네모트론 해커톤에 참여한 레렙업 팀은 유튜브 등의 스트리밍 영상 링크를 붙이면 새로운 동영상을 만들 수 있는 CLI 과 웹 UI 등을 만들었으며 기본적으론 네모트론 34B-I 모델을 사용하여 구현하였으며 실제 비디오를 편집 하여 쇼츠와 비슷한 영상을 만들 수 있는 데모를 진행했다. MRO Agent 팀에서는 실무에 바로 적용할 수 있는 방대한 항공 분해 정비 등의 대한 에이전트 구축, 정비들을 위한 항공문서 메뉴얼 등은 몇 개의 데이터 셋으로 구조화 하여 데이터 접근 빌드 에이전트를 통해 기존의 문서를 이해하고 QA 에이전트를 통해 답을 구하는 에이전트를 준비했다. 이 역시 엔비디아 네모트론을 활용했다.

NUKK 팀에서는 최근 6,000 이상의 코스닥 지수를 보이고 있지만 반대로 최근 상장폐지율이 늘어나고 있는데 이를 토대로 미리 예방하는 에이전트를 구축했는데 이는 공인회계사 라는 직업을 통해 여러 회사들의 감사에 대한 경험을 녹여서 별도의 에이전트를 구축했다. SearchLLM팀에선 NemoBriefing 이라는 이름의 에이전트를 제작했는데 정성적인 평가를 위해 LLM 리더보드 를 활용하다 보니 각기 AI 에이전트들의 수치적인 값들을 신뢰할 수있도록 노력했다고 밝혔다. 에이전트이 빌드는 Super 와 Nano 메모트론을 활용했으며 이를 웹으로 구현하기 위해 ReACT 를 활용했다.
에이전트맨팀은 기존의 웹 크롤링 방식이 아닌 온프라미스 제품 매칭을 통해 이커머셜 및 온라인 마켓에 등록되어 있는 상품정보 등을 수집, 분석하여 프로덕트 매핑 에이전트를 선보였다. 동일한 제품 이지만 이미지, 텍스트로 구현된 상품 정보가 다를 수 있기 때문에 로컬 LLM 구현을 기본으로 기존의 데이터 셋 들을 최대한 만힝 확보하여 LoRA를 활용 총 3가지 항목에 가중치를 두어서 동일한 제품으로 인식하여 성능을 향상 시키는 방법을 취했다.
그래서 인상된 하나의 상품은 4가지 레이어로 구조화 하였으며 기본적으로 나노 메모트론의 학습 모델로 그리고 상세한 스펙 정보 등은 슈퍼 메모트론 모델로 활용 으로 구현했다.
Team Zest 에서는 네모트론 모델을 파이넨싱, 뱅킹 도메인 모델로 .. 뱅킹 도메인 관련해서 특정한 환경에서 강화 학습을 목표로 진행하여 모델이 학습 결과를 내기 위해서 Tau3-Bench 뱅킹 도메인 테스트를 통해 성능을 확인 방법을 취해 실제 엔비디아 직원들에게 많은 질문을 받았다.

▲ 엔비디아 네모트론 해커톤 2026 우승을 차지한 ‘노타 AI’ (중앙)
여러 군데에서 진행되는 해커톤 대회는 팀을 구성해 일정한 시간을 두고 개발하는 일이 만큼 시간적인 여유가 많지 안힉 때문에 엔비디아의 DGX 스파크, 네모트론 등올 100% 활용하기가 쉽기 않은 환경이다. 그럼에도 불구 하고 대부분의 팀들이 기존의 LLM 엔진에서 네모트론 으로 대체를 했을 때 어떤 정도의 수준 혹은 성능 향상 등에 대한 부분을 하이라이트한 팀들이 좋은 반응을 받았다.







