
인공지능(AI) 도입 트렌드가 거대 모델 자체의 크기 경쟁에서 실제 비즈니스 환경 내의 '안정적인 구동과 비용 최적화'로 빠르게 이동하고 있다. 이러한 전환점 속에서 NHN클라우드는 2026년 5월 26일 오전 서울 중구 더 플라자 호텔 서울에서 기자간담회를 개최하고, AI 인프라부터 플랫폼, 서비스까지 아우르는 통합 AI 풀스택 브랜드인 'NHN 팩토리X(FactoryX)'와 중장기 사업 전략을 전격 공개했다.

이날 간담회장에는 NHN클라우드의 기술과 인프라 사업을 실질적으로 이끄는 핵심 주역들이 대거 연사로 나섰다. 김동훈 대표의 오프닝 발표를 시작으로 강민수 최고인프라책임자(CIO), 김태형 최고기술책임자(CTO), 그리고 서비스 레이어의 실무 적용을 전담하는 NHN엔터프라이즈의 안성민 대표가 차례로 연단에 올라 자사 풀스택의 실체적 강점을 설명했다.
낮은 GPU 활용률과 낭비되는 인프라… 현장 경험 담은 '팩토리X'의 탄생

김동훈 대표는 발표를 시작하며 현재 글로벌 AI 인프라 시장의 빠른 성장세와 대비되는 기업 현장의 실질적인 운영 비효율성 지표를 지적했다. 글로벌 AI 인프라 시장은 2030년까지 약 3,944억 달러 규모로 급성장하고 있으며, 한국 정부 또한 올해 AI 인프라에만 2조 5,000억 원의 자금을 집중 투자하고 있는 실정이라고 설명했다. 하지만 고가의 GPU 자원을 확보한 실제 기업 중 무려 68%가 자원의 70% 미만을 활용하고 있으며, 100% 가깝게 활용해 비즈니스 가치를 창출하는 기업은 단 7%에 불과한 상황이라고 짚었다.

김 대표의 설명에 따르면, NHN클라우드는 국내에 GPU 서비스를 전문적으로 다루는 사업자가 없던 7년 전부터 관련 기술을 준비하여 총 1,500개가 넘는 AI 프로젝트를 운영한 경험을 축적해 왔다. 아시아 최초로 고밀도 외기 냉각 방식(HVAC)을 도입한 광주 국가 AI 데이터센터(컴퓨팅 연산능력 88.5 PF, 저장용량 107 PB) 구축이 그 시발점이 되었다고 덧붙였다.

나아가 과학기술정보통신부와 정보통신산업진흥원(NIPA)의 'AI 컴퓨팅 자원 활용기반 강화 사업'을 통해 단일 최대 규모인 7,656장의 차세대 엔비디아 블랙웰(B200) GPU를 성공적으로 확보했음을 강조했다. 이 중 4,080장의 고성능 GPU를 단일 클러스터로 결합해 내는 독보적 엔지니어링 역량을 보였다고 설명했다. 이 노하우는 판교 NCC1 센터의 고밀도 설계 경험과 결합되어 양평데이터센터 구축 및 가동의 밑바탕이 되었다고 덧붙였다. 양평데이터센터는 7개월의 공기 동안 비상 발전기 무중단 전환 테스트를 마치고 일 최대 500여 명의 전문 인력을 투입해 총 957대의 물리 서버 노드 세팅을 완수했다고 밝혔다.

김 대표는 이러한 노하우를 상용화한 팩토리X가 물리 인프라(Layer 1), 자원 오케스트레이션 플랫폼(Layer 2), 자율 에이전트 구동 중심의 서비스(Layer 3)의 3가지 핵심 아키텍처를 관통해 기업 프로젝트를 실질적인 비즈니스로 연결해 줄 수 있다고 역설했다.
초고밀도 엑사스케일 연산망 구축과 100% 수랭식 냉각 공조 설계

인프라 레이어의 세부 발표를 맡은 강민수 최고인프라책임자(CIO)는 독자적인 AI 물리 인프라 구축 시 기업들이 직면하는 심각한 수급 지연 문제에 대해서 현재 GPU 가속 서버 기기 정식 주문부터 입고까지 최소 26주, 인피니밴드 스위치 및 케이블 조달에는 48주 이상, 고속 SSD 플래시 스토리지 도입에는 8~10주가 소요되는 실정이라고 지적했다. 이로 인해 설계부터 실제 가동까지 최소 52주(1년) 이상이 걸려, 전 세계 글로벌 기업의 약 40~60%가 AI 서비스 배포 지연을 겪고 있는 현실을 공유했다.


강 CIO는 이를 해결하고자 양평데이터센터를 구축하고 전면 수랭식(Liquid-Cooling) 냉각 엔지니어링을 선제적으로 도입했다고 밝혔다. 차세대 블랙웰 B200 칩셋은 열방출량이 1,200W에 달하고, 향후 출시될 루빈(Rubin) 아키텍처는 칩당 1,500W에 육박하기 때문에 기존의 공랭식 냉각 방식으로는 열 제어가 불가능하다고 단언했다. 수랭 설비를 도입할 경우 냉각수의 압력, 유량, 온도를 센서망으로 실시간 감지 통제할 수 있어 미세 누수 시 해당 구간을 즉각 물리적으로 차단할 수 있다고 설명했다. 전면 수랭식 설비 도입을 통해 공랭 방식 하에서 연간 3.8~5.2%에 달하던 개별 GPU 부품의 장애율을 1.2~1.8% 대 수준으로 대폭 감축했으며, 평균 무고장 운영 시간(MTBF) 또한 18만 시간에서 48만 시간으로 약 2.6배 연장하는 하드웨어 안정성을 실현했다고 강조했다. 전 세계 AI 서버 내 수랭식 냉각 도입 비율이 2025년 23%에서 2026년 57%로 급등할 것으로 예상되는 만큼, NHN클라우드가 업계 트렌드를 기민하게 주도하고 있음을 피력했다.

현재 NHN클라우드는 광주 센터의 H100 GPU 기반 88.5 PF 및 국산 고성능 NPU 기반 11 PF 전력량을 필두로, 양평 리전의 9.1 EF 및 18.3 EF 연산력을 포함해 도합 '27.4 EFLOPS(FP8 기준)'의 물리 AI 컴퓨팅 인프라를 가용하고 있다고 설명했다. 해당 인프라는 즉시 사용 가능한 가상화 GPUaaS와 대기업 및 국가 규제 기관의 보안 요구에 맞춰 설계하는 맞춤형 프라이빗 AI 인프라의 두 가지 형태로 공급된다고 전했다.
'GPU 라이브'와 'AI 이지메이커' 플랫폼을 통한 유휴 비용 절감 겨냥

플랫폼 레이어 발표를 이끈 김태형 최고기술책임자(CTO)는 고가의 가속기 자원을 원활하게 운영 통제할 수 있는 플랫폼이 부재할 때 수반되는 기업의 재무적 손실을 제기했다. 엔비디아 H100 가속기 단일 카드는 연산 로드가 없는 유휴(Idle) 대기 상태에서도 시간당 약 2.10달러의 비용 누수를 발생시킨다고 경고했다. 1,000장 규모의 가속 클러스터를 보유한 기업이 평균 자원 가동률을 50% 수준으로 정체시킨다면 매년 약 920만 달러(한화 약 140억 원 상당)의 자본이 실질 성과 없이 손실로 사라지게 된다고 분석했다.


이에 NHN클라우드는 가상화 오버헤드를 극도로 억제해 베어메탈 물리 서버 성능에 완전히 수렴하는 경량 오케스트레이션 엔진인 'GPU 라이브(GPU Live)'를 적용했다고 소개했다. GPU 라이브는 조직 내 커스텀 정책 기반 우선순위 동적 제어, 초미세 단위 가상 슬라이싱 및 실시간 가속 자원 회수, 통합 실시간 텔레메트리 대시보드 연계 기능을 갖추고 있다고 설명했다. 이러한 지능형 오케스트레이션 플랫폼이 성공적으로 안착하면 기존 28% 수준의 저조한 GPU 가동 활용률 지표가 단숨에 최대 73% 선까지 급상승하는 실질 개선 효과를 거둘 수 있다고 강조했다. 아울러 동일 자원 대비 1.4배 많은 요청을 수용할 수 있으며, 콜드 스타트 레이턴시를 기존 75초에서 단 1.2초 수준으로 대폭 단축하여 대기 지연율을 최대 61배 가까이 줄인다고 덧붙였다.

이와 더불어 팩토리X 플랫폼 레이어의 또 다른 한 축인 'AI 이지메이커(AI EasyMaker)'가 기계 학습 라이프사이클의 복잡도를 완벽히 추상화하여 개발 생산성을 보정해 준다고 설명했다. 각기 파편화된 외부 딥러닝 라이브러리와 프레임워크 간의 종속성 충돌 예외 문제를 도커(Docker) 컨테이너 기반 표준 가상화 환경 템플릿으로 규격화해 소프트웨어 환경 불일치 결함을 예방하며, 개발자가 하위 레이어의 GPU 물리 구조를 의식하지 않고 코드와 데이터에만 집중할 수 있게 지원한다고 덧붙였다.
생성형 AI 도입 성과의 장벽 극복과 자율형 에이전트 '프로젝트 X'


서비스 레이어를 담당한 NHN엔터프라이즈 안성민 대표는 글로벌 비즈니스 도처에서 실시간으로 목격되고 있는 심각한 생성형 AI 도입 효과 장벽(Gen AI Divide) 현상을 지적했다. 2025년 8월 MIT 경제연구팀 보고서를 인용해 생성형 AI를 자사 워크플로우 내에 전격 도입한 다수 기업 중 무려 95%가 실질 생산성 향상이나 비용 절감 등 뚜렷한 재무 성과적 임팩트를 전혀 도출해 내지 못했다고 밝혔다. 또한 BCG 보고서에서도 오직 전체 도입사의 22%만이 단순 초동 파일럿 테스트 단계를 넘어섰을 뿐이며, 실제 AI 혁신을 가치 사슬 최전선에 적용해 실실적 가치를 창출 중인 모범 기업은 4% 영역에 머무르고 있는 실정임을 전했다.


안 대표는 이러한 도입 단절의 원인이 단순히 AI 모델의 한계 때문이 아니라, AI 에이전트가 단순한 정보 응답용 가상 챗봇 수준을 극복하고 회사 내부 레거시 시스템 기밀망에 중단 없이 안전하게 접속하며 24시간 자율적 트랜잭션을 마감할 수 있는 '에이전트 클라우드 가동 플랫폼 환경' 자체가 부재했기 때문이라고 진단했다. 이를 극복하기 위해서는 엄격한 내부 데이터 보안 및 컴플라이언스 통제, ERP 및 사내 전자 결재망 등 핵심 레거시 사내 전산망과의 유기적인 데이터 연계, 월정액 기반 사용량 대비 연산 운용비의 최적화라는 3가지 보안 및 전산 아키텍처 연계 요건이 전제되어야 한다고 보았다.

이를 해결하고자 NHN클라우드는 컨테이너 가상화 기술과 자율 구동 정책을 결합한 통합 에이전트 전용 가동 인프라인 '프로젝트 X(Project X)'를 올 하반기 출시할 예정이라고 공식 발표했다. 프로젝트 X는 일반 현업 실무자가 일상적인 자국의 자연어(Natural Language) 지시만으로 맞춤 가속 업무를 자동 수행하는 버추얼 에이전트 일꾼을 웹 콘솔 상에서 즉각 생성 및 구동하게 돕는다고 소개했다. 프로젝트 X의 AI 에이전트는 야간이나 휴일 시간대에 서버망 내 이상 트래픽 지연이나 과부하를 감지해 담당자에게 정밀 세부 장애 진단 경보 알림을 송출하고, 인프라 복구 스크립트를 스스로 자동 선택 기동하는 등 주어진 미션(Mission) 도달에 필요한 세부 태스크(Task) 전 과정을 직접 기획·실행한다고 설명했다.


프로젝트 X는 물리적 망분리 규정이 상시 강제되는 최상위 보안 등급의 금융권, 사법 행정망, 국방 군사 레거시망 연계를 위한 '프라이빗 구축형 에이전트 가동 모드'를 핵심 세일즈 모델로 가동하는 동시에, 초동 도입이 유용한 저비용 고효율 구조의 '퍼블릭 표준형 에이전트 클라우드' 투트랙 라인업을 제공할 계획이라고 덧붙였다.
팩토리X가 가져올 국내 AI 실행 생태계의 패러다임 변화

NHN클라우드의 독자적인 차세대 AI 풀스택 브랜드인 '팩토리X'는 고가의 해외 연산 칩셋을 단순 임대 중개해 마진을 챙기던 기성 호스팅 CSP 비즈니스의 지극히 평범한 구도를 전면 탈피하겠다는 의지를 투영하고 있다.
특히 이번 팩토리X 출범을 계기로 기존 클라우드 사업 구조를 AI 중심으로 과감히 재편해 나갈 방침을 공표했다. 최근 3년간 연평균 24%의 성장세를 이어온 역량을 바탕으로 두 자릿수 성장률을 지속하는 한편, 전체 매출 중 AI 사업 비중을 2025년 13%에서 2026년 38%로 대폭 늘리고, 오는 2027년에는 클라우드와 AI의 매출 비중을 50 대 50 수준으로 균형 있게 재편하겠다는 구체적인 사업 로드맵을 제시했다. 이러한 공격적인 로드맵을 바탕으로 대한민국이 미국과 중국에 이어 세계 3대 인공지능 강국(AI G3)으로 도약하는 데 기여하는 국가대표 AI 인프라 기업으로 자리매김 하겠다는 구상도 함께 밝혔다.

NHN클라우드가 지난 7년간 공공과 민간 영역의 다양한 AI 프로젝트를 가동하며 축적해 온 검증된 엔지니어링 유산들이 고스란히 브랜드 전체에 녹아든 만큼, 대한민국의 데이터 주권을 수호하는 구심점이자 기업 비즈니스의 실질 실행 가속 엔진으로서 미국과 중국의 빅테크 공습 속에서 대한민국을 세계 3대 인공지능 강국으로 이끌어갈 NHN클라우드의 향후 행보에 뜨거운 관심과 귀추가 주목된다.
기사원문 : https://kbench.com/?q=node/279046 Copyrightⓒ kbench.com








