비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

알리바바, Qwen 3.5 Omni 출시…텍스트·음성·영상 동시 처리하는 멀티모달 AI

2026.04.03. 10:14:14
조회 수
37

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

중국 빅테크(Big Tech) 기업 알리바바(Alibaba)의 AI 연구팀 'Qwen 팀'이 텍스트, 음성, 이미지, 영상을 단일 계산 파이프라인(pipeline) 내에서 동시에 처리하는 멀티모달(multimodal) AI 모델 'Qwen 3.5 Omni'를 공개했다. 마크테크포스트(MarkTechPost)에 따르면, 이 모델은 2026년 3월 30일 정식 공개됐으며 36개 언어로 실시간 음성 합성(TTS, Text-to-Speech)을 지원한다.

Qwen 3.5 Omni의 가장 두드러진 기술적 특징은 통합 멀티모달 처리 능력이다. 기존 AI 모델이 텍스트, 음성, 이미지 등 입력 형식별로 별도 처리 모듈을 사용하는 것과 달리, 이 모델은 모든 형태의 입력을 단일 파이프라인 내에서 통합적으로 처리한다. 자동 음성 인식(ASR, Automatic Speech Recognition) 분야에서는 113개 언어 및 방언을 지원하며, 음성 합성은 36개 언어에서 구현된다. 또한 동적 ARIA 정렬(alignment) 방식을 통해 고정 비율의 텍스트-오디오 토크나이저(tokenizer) 방식을 대체했으며, 컨텍스트 윈도(context window)는 기존 32K에서 256K로 8배 확장됐다.

음성 복제(voice cloning) 기능도 탑재됐다. 사용자가 짧은 음성 샘플을 업로드하면 모델이 해당 목소리를 학습해 응답에 적용하며, 의미 기반 끊기 인식(semantic interruption)도 지원한다. 특히 '오디오-비주얼 바이브 코딩(Audio-Visual Vibe Coding)' 기능은 사용자가 화면 녹화나 작업 영상을 올리면 그 내용을 보고 들으며 기능하는 코드를 자동으로 생성해 주는 독창적인 기능이다. 이 외에도 텍스트 입력 기반 음성 대화와 이미지 기반 음성 응답을 동시에 처리하는 멀티턴(multi-turn) 대화 기능도 지원한다.

Qwen 3.5 Omni는 오픈소스(open-source) 형태로 허깅페이스(Hugging Face)를 통해 공개돼 있으며, 스마트폰이나 노트북과 같은 소비자용 하드웨어에서도 구동 가능한 경량 모델도 포함돼 있다. 알리바바의 이번 출시는 중국 AI 기업들이 오픈소스 멀티모달 AI 경쟁에서 글로벌 주도권을 확보하려는 전략의 일환으로 풀이된다. Qwen 팀은 이번 모델이 텍스트 기반 대화 품질과 음성·영상 처리 능력을 동시에 극대화한 것으로, 향후 교육, 의료, 고객 서비스 등 다양한 분야에서 복합 모달 AI 활용이 확산될 것으로 전망했다.

자세한 내용은 마크테크포스트(MarkTechPost)에서 확인할 수 있다.

이미지 출처: 이디오그램 생성




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
2/1
채비(CHAEVI), 미국 현지 생산 체제 구축... 6조 원 규모 NEVI 시장 공략 글로벌오토뉴스
[영상] 고작 반 바퀴만 돌렸을 뿐인데, 벤츠 '스티어 바이 와이어' 체험기 글로벌오토뉴스
KGM, ‘2026 파트너스 데이’ 개최... 미래 성장 전략 및 동반 성장 강화 글로벌오토뉴스
“스팀도 이제 고환율 시대?” 게임 가격, 한국인 기준 20% 오를 수도 있다 게임동아
미국 특허청, ‘팰월드’ 소송 중인 닌텐도의 포켓몬 전투 특허 거절 게임동아
조이시티, '임진왜란: 조선의 반격’ 4월 28일 출시 게임동아
넥써쓰, ‘카오스W’ 사전등록 개시… 크로쓰 플랫폼 라인업 확대 게임동아
초이락 ‘피닉스맨’, 불새 ‘아비타’와 ‘트라이기어’ 완구 3종 세트 출시 게임동아
챗GPT, 위치 공유 기능 도입…"내 근처 카페" 물으면 정확한 답 돌아온다 AI matters
알리바바, Qwen 3.5 Omni 출시…텍스트·음성·영상 동시 처리하는 멀티모달 AI AI matters
앤트로픽 코워크 에이전트, 출시 초반 클로드 코드 능가하는 채택 속도…기업 시장 공략 AI matters
오픈AI, 185조 6,840억 원 역대 최대 펀딩 완료…기업 가치 약 1,297조 원 달성 AI matters
엔씨(NC), 새 사명 ‘Next&Creative’로 확정∙∙∙ 미래 도전과 창의성 강조 게임동아
컴투스 ‘서머너즈 워’, 12주년 기념 글로벌 팬 헌정 축제 전야제 이벤트 진행 게임동아
세븐나이츠 키우기, 신규 영웅 ‘트루드’ 업데이트 기념 이벤트 진행 게임동아
[기획] 귀여운 해커부터 지옥의 악마까지 만날 수 있는 4월의 라인업 게임동아
크래프톤, AI 모델 브랜드 ‘Raon’ 출범. 4종 오픈소스 공개 게임동아
“배우기는 쉽고 전략은 깊게”... 코리아보드게임즈, 신작 보드게임 3종 출시 게임동아
‘바람의나라’, 서비스 30주년 기념 업데이트 진행 게임동아
스마일게이트 희망스튜디오, ‘로스트아크’ 커뮤니티와 손잡고 소아암 환아 지원 기부 캠페인 전개 게임동아
이 시간 HOT 댓글!
1/4