수퍼톤이 클라우드나 고가의 GPU 없이도 실시간으로 텍스트를 고품질 음성으로 변환하는 초경량 AI 모델을 공개하며 음성 AI 기술 대중화에 속도를 내고 있다. 회사는 지난 19일 온디바이스 기반의 TTS(Text-to-Speech) 모델인 ‘수퍼토닉(Supertonic)’을 누구나 자유롭게 사용하고 수정·배포할 수 있는 형태의 오픈소스로 공개했다고 20일 밝혔다.
수퍼토닉은 일반 노트북이나 모바일 환경에서도 빠른 속도로 구동할 수 있도록 설계된 것이 가장 큰 특징이다. 사용자의 기기 자체에서 AI 연산이 이뤄지는 온디바이스 방식이기 때문에 클라우드나 네트워크 연결 없이도 텍스트를 고품질 음성으로 변환할 수 있다. 클라우드 서버로 데이터를 송수신할 필요가 없어 지연 문제가 사실상 사라지고 정보 유출 우려 역시 크게 줄어든다.
수퍼톤이 온디바이스 기반의 TTS 모델 ‘수퍼토닉’ 오픈소스를 공개했다.
특히 수퍼토닉은 약 6600만개 파라미터로 구성된 초경량 모델이다. 교육용 초소형 컴퓨터뿐 아니라 고가의 GPU가 없는 일반 노트북이나 모바일 환경에서도 실시간에 가까운 속도로 음성을 생성할 수 있다. 수퍼톤 내부 벤치마크 결과, 일반 노트북 환경에서 수퍼토닉은 초당 2500자 이상의 텍스트를 음성으로 변환한 것으로 나타났다. 이는 글로벌 주요 TTS 모델이 초당 400자 내외를 생성하는 것과 비교해 월등히 빠른 수치다.
개발 환경도 폭넓게 지원한다. 수퍼토닉의 소스코드는 개발자 협업 플랫폼 깃허브(GitHub)에 공개되며, 모델 학습 결과물인 체크포인트와 체험용 데모 페이지는 AI 모델 공유 플랫폼 허깅페이스(Hugging Face)에서 제공된다. 소스코드는 파이썬, C++, 자바스크립트 등 8개 이상의 프로그래밍 언어로 구성돼 개발자 접근성을 높였다.
수퍼톤은 이어 올해 안으로 ‘수퍼톤(Supertone) API’를 통해 또 다른 온디바이스 기반 TTS 모델인 ‘소나 스피치 2t(Sona Speech 2t)’도 공개할 계획이다. 수퍼토닉이 오픈소스 형태라면, 소나 스피치 2t는 API로 제공돼 개발자가 다른 서비스의 기능을 자사 서비스에 손쉽게 연동할 수 있다는 점이 차이점이다. 영어, 한국어, 일본어, 스페인어, 포르투갈어 등 5개 언어 기반 TTS를 지원할 예정이다.
이교구 수퍼톤 대표는 “수퍼토닉 오픈소스 공개를 통해 온디바이스 TTS 기술의 표준화와 경량화를 선도하고 개발자 커뮤니티와의 협업을 확대할 계획”이라며 “AICC, 음성 에이전트, 에듀테크, 이러닝 등 다양한 산업군에서 음성 AI 기술 활용 범위를 더욱 넓혀가겠다”고 말했다.
이준문 기자/jun@newstap.co.kr
ⓒ 뉴스탭(https://www.newstap.co.kr) 무단전재 및 재배포금지
[뉴스탭 인기 기사]
· “첫눈도 오기 전인데” 내셔널지오그래픽 ‘에이라 패딩’ 판매 200% 급증
· 조텍 RTX 5080, 189만9천원 한정 특가! 11일 단 3일간 열린다
· 기가바이트, 라이젠 9000 대응 ‘B850 EAGLE ICE’ 화이트 메인보드 출시
· 캐논, ‘EOS R6 Mark III’와 ‘RF45mm F1.2 STM’ 공개… 하이브리드 촬영의 새 기준 제시
· 갤럭시 S26, 카메라 섬 돌아오고 두께 6.9mm로 더 얇아진다




[