비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

큐웬, AI 비전-언어 모델 ‘Qwen2.5-VL-32B’ 출시… “주관적 경험과 수학적 추론에 최적화”

2025.03.26. 18:08:48
조회 수
449
4
댓글 수
1

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

알리바바의 Qwen 팀은 24일(현지 시간) 자사 블로그를 통해 새로운 시각-언어 모델인 Qwen2.5-VL-32B-Instruct를 오픈소스로 공개했다. 이 모델은 기존 Qwen2.5-VL 시리즈의 최적화 버전으로, 인간 선호도에 더 부합하는 응답과 수학적 추론 능력, 세밀한 이미지 이해 및 추론 기능을 크게 향상시켰다.

Qwen 팀이 공개한 정보에 따르면, 이번에 출시된 Qwen2.5-VL-32B는 강화학습을 통해 출력 스타일을 조정하여 더 상세하고 형식이 개선된 응답을 제공한다. 이는 사용자들이 선호하는 응답 방식에 더 가깝게 설계되었다는 점이 특징이다. 모델은 특히 복잡한 수학 문제 해결 정확도를 크게 개선했으며, 이미지 파싱, 콘텐츠 인식, 시각적 논리 추론과 같은 작업에서 향상된 정확성과 상세 분석 능력을 보여준다.

Qwen2.5-VL-32B-Instruct는 유사한 규모의 최신 모델들, 예를 들어 미스트랄 스몰-3.1-24B(Mistral-Small-3.1-24B)와 젬마-3-27B-IT(Gemma-3-27B-IT)와 같은 기준 모델들을 능가하는 성능을 보여주었다. 심지어 더 큰 규모의 Qwen2-VL-72B-Instruct도 뛰어넘는 성과를 달성했다. 특히 MMMU, MMMU-Pro, MathVista와 같은 복잡한 다단계 추론에 중점을 둔 멀티모달 작업에서 상당한 이점을 보여주었다. 주관적인 사용자 경험 평가를 강조하는 MM-MT-Bench 벤치마크에서 Qwen2.5-VL-32B-Instruct는 기존의 Qwen2-VL-72B-Instruct보다 상당한 차이로 앞서는 성능을 보였다.

이미지 이해 능력 외에도, Qwen2.5-VL-32B-Instruct는 순수 텍스트 처리 능력에서도 같은 규모에서 최고 수준의 성능을 달성했다.

Qwen 팀은 모델의 능력을 시연하기 위한 사례로 교통 상황에서의 추론 문제를 공개했다. 이 사례에서는 사용자가 대형 트럭을 운전하며 시속 제한이 100km인 도로에서 12시에 출발하여 110km 떨어진 곳에 13시 전에 도착할 수 있는지를 질문했다. 모델은 이에 대해 단계별 분석을 통해 필요한 이동 시간을 계산했다. 거리 110km를 최대 속도 100km/h로 이동할 경우 1.1시간이 소요되며, 이는 1시간 6분에 해당한다. 따라서 12시에 출발하면 도착 시간은 13시 6분이 되어, 13시 전에 도착하는 것은 불가능하다는 결론을 정확히 도출했다.

Qwen 팀은 공식 블로그를 통해 "Qwen2.5-VL-32B가 '빠른 사고' 패러다임 내에서 강화학습을 통해 주관적 경험과 수학적 추론을 최적화하는 데 중점을 두었다면, 다음 연구 방향은 길고 효과적인 추론 과정을 우선시하여 고도로 복잡한 다단계 시각적 추론 작업에서 시각 모델의 한계를 뛰어넘는 것이 될 것"이라고 밝혔다.

해당 기사의 원문은 링크에서 사용할 수 있다.

이미지 출처: 큐웬

기사는 클로드와 챗GPT를 활용해 작성되었습니다.




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 신상품뉴스 전체 둘러보기
1/1
오오오오오 노잼? 애플 M5 신제품 공개 총정리! (아이패드 프로 / 맥북 프로 / 비전프로) (1) 동영상 있음 주연 ZUYONI
“10시간 서 있어도 발 편해요” 숨인솔 DI 깔창 출시 직후 완판… 2차 물량 긴급 재입고 뉴스탭
지클릭커, 10만원 이하 ‘멀티미디어 스트림덱 SD16’ 출시… 숫자패드·계산기·스트림덱을 한 손에 뉴스탭
니콘, 첫 시네마 카메라 ‘ZR’ 출시 기념 정품 등록 프로모션 진행 뉴스탭
“작지만 강력하다”... 캐논, 소호 맞춤 복합기 ‘PIXMA TS’ 시리즈 공개 뉴스탭
파타고니아 코리아, 50년 헤리티지 담은 ‘레트로-X 컬렉션’ 공개 뉴스탭
“사무용부터 게이밍까지 한 번에”... 알파스캔, 120Hz 보더리스 모니터 출시 (1) 뉴스탭
케이스티파이, 충청권 상륙! ‘대전신세계점’서 한화 이글스 케이스 단독 출시 뉴스탭
“코골이 소리 안녕”… 앤커, 세계 최초 ANC 탑재 수면용 이어폰 ‘A30’ 출시 뉴스탭
게임·4K 스트리밍까지 완벽 지원… ipTIME, AX3000급 와이파이6 공유기 출시 (1) 뉴스탭
커세어, AI 딥러닝 워크스테이션용 3000W 초고출력 파워서플라이 ‘WS3000’ 출시 뉴스탭
알파스캔, 4면 보더리스 AH-IPS 패널 탑재 120Hz 모니터 신제품 2종 출시 다나와
ipTIME, AX3000급 와이파이6 지원 기가 와이파이 공유기 ‘AX3000SE’ 출시 다나와
다크플래쉬, 합리적 가격과 균형 잡힌 성능 ‘Ellsworth S31’ CPU 공랭 쿨러 출시 (1) 다나와
알파스캔, 4K UHD 240Hz, DP2.1 올레드 게이밍 모니터 ‘AGON 276UZD’ 출시 다나와
로지텍, 로우 프로파일 아날로그 게이밍 키보드 ‘G515 RAPID TKL’ 출시 다나와
오오오오오. 노잼. 애플 M5 신제품 3종 정리 동영상 있음 UnderKG
로지텍, ‘G PLAY DAYS’로 가을 특가 돌입… PRO X·G515 등 핵심 라인업 총출동 뉴스탭
“2만 원 이하로 230W TDP 지원”... 다크플래쉬, 가성비 쿨러 ‘Ellsworth S31’ 시리즈 출시 (1) 뉴스탭
마이크로닉스, 파노라믹 디스플레이 케이스 ‘쿨맥스 크리스탈’ 출시… 쿨링과 디자인 모두 잡았다 (1) 뉴스탭
이 시간 HOT 댓글!
1/4