로그인하세요
알림
설정
레프트패널 닫기
관심
최근본
마이페이지
출석체크
카테고리
    서비스 바로가기
    • 자동차
    • 인기 서비스조립PC
    • PC견적
    • PC26
    • 신규 서비스LIVE쇼핑
    • 커뮤니티
    • 이벤트
    • CM추천/문의
    • 오늘의 특가
    앱 서비스
    • 자동차
    • PC견적
    • 장터
    인기 쇼핑몰
    • 지마켓
    • 옥션
    • 11번가
    • 롯데아이몰
    • 쿠팡
    • 롯데닷컴(롯데온)
    • 신세계몰
    • 현대Hmall
    • CJ 온스타일
    • GS샵
    • 하이마트
    • 엘롯데
    • 이마트몰
    • 홈플러스
    • NS몰
    • SK스토아
    • KT알파 쇼핑
    • 전자랜드
    • 무신사
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) (우) 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    사용법 보기
    MY쇼핑이란? 자주 쓰는 쇼핑몰을 연결하면 쇼핑몰 주문내역을 한 번에 확인할 수 있습니다. 쇼핑몰 계정은 고객님의 핸드폰에만 저장되어 안전합니다.
    편리한 구매내역 확인. 다양한 쇼핑몰의 주문내역을 한 곳에서 확인해보세요.
    가격비교와 최저가 쇼핑을 한 번에. 자주 구매하는 상품은 가격비교를 통해 저렴하게 구매하세요.
    보안은 필수! 쉽고 편한 가치 쇼핑. 쇼핑몰 계정은 고객님의 핸드폰에만 암호화 저장되어 안전합니다. 쇼핑몰 연결
    다나와 홈

    커뮤니티 DPG

    일반뉴스

    • 게시판
    • 상품포럼
    • 뉴스
    • 동영상
    • 커뮤니티 공지사항
      소비자사용기
    • 특가몰
      자유게시판
    • 이달의 이벤트
      유머게시판
    • 당첨자발표게시판
      댕냥이게시판
    • 포인트 마켓
      Q&A게시판
    • 다나와 래플
      상품의견
    • 모두의 경매
      체험단
    • 오늘도 출석체크
      엄근진게시판
    • 입소문쇼핑
      쇼핑몰후기
    • 메인가자
      A/S후기
    • 당첨후기
    • 컴퓨터
      AI
    • 푸드
      취미
    • 최신뉴스
      일반뉴스
    • 기획뉴스
      신상품뉴스
    • 쇼핑뉴스
      테크팁
    • 다나와리포터
      구매가이드
    • 전문가리뷰
      인기순위가이드
    • 벤치마크
      차트뉴스
    • 가격동향
    • 고나고
      공구왕황부장
    • 노써치
      도레
    • 딴트공 말방구 실험실
      라이브렉스
    • 레고매니아
      맛상무
    • 모터피디
      무적풍화륜
    • 민티저
      보드나라
    • 뻘짓연구소
      여행매거진 트래비TV
    • 오토기어
      조코딩 JoCoding
    • 인프제 INFJ
      주연 ZUYONI
    • 진블로그
      집마 홀릭TV
    • 톡써니
      포마: 탈 것을 리뷰하는 남자
    • 쿨엔조이
      훅간다TV
    • AI 매터스
      Allthatboots TV
    • DmonkTV
      Hakbong Kwon
    • Motorgraph
      PC SNAP
    • Producer dk
      THE EDIT
    • UnderKG
      다나와 공식채널
    • 답나와
      리뷰나와
    • 샵다나와 조립갤러리
      직장인 다나왕
    >
    이전 글
    다음 글
    AI matters

    애플, 이미지 처리 속도 85배 향상 AI 모델 'FastVLM' 공개...아이폰 17 탑재되나

    2025.08.07. 11:06:20
    읽음328

    애플이 이미지와 텍스트를 함께 이해하는 새로운 AI 모델 'FastVLM'을 공개했다. 이 모델은 기존 AI보다 3.2배 빠르게 이미지를 분석하고 답변을 생성할 수 있으면서도 정확도는 그대로 유지한다. FastVLM의 핵심은 고화질 이미지를 효율적으로 처리하는 새로운 기술 'FastViTHD'다.


    실제 하드웨어에서 85배 빠른 속도 구현, 다양한 모델 크기 지원

    FastVLM의 가장 인상적인 특징은 M1 맥북 프로에서 실제 측정한 놀라운 속도 개선이다. 같은 크기의 언어 모델을 사용했을 때 기존 LLaVA-OneVision AI 모델보다 85배 빠르게 첫 번째 답변을 생성한다. 이는 TTFT(Time-to-First-Token)라고 불리는 지표로 측정되는데, 이미지를 이해하는 시간과 언어 모델이 답변을 준비하는 시간을 합친 것이다.

    더욱 놀라운 점은 이 성능을 모델 크기를 3.4배나 줄이면서 달성했다는 것이다. FastVLM은 0.5B부터 7B까지 다양한 크기의 언어 모델과 결합하여 사용할 수 있으며, 각각에서 우수한 성능을 보였다.

    5단계 구조로 설계된 FastViTHD, 64배 압축 기술 적용

    FastVLM의 핵심 기술인 FastViTHD는 이미지에서 추출하는 정보량을 기존 모델의 16분의 1로 줄였다. 이 기술은 5단계로 구성된 독특한 구조를 가지고 있다. 처음 3단계에서는 RepMixer라는 효율적인 처리 방식을 사용하고, 마지막 2단계에서는 셀프 어텐션이라는 정교한 분석 방식을 적용한다.

    단계별로 2개, 12개, 24개, 4개, 2개의 계층을 가지며, 정보 처리 용량도 96차원부터 1536차원까지 점진적으로 확장된다. 특히 기존 모델이 16배 압축을 했다면, FastViTHD는 64배 압축을 통해 더욱 효율적인 처리가 가능하다. 이 모델은 DataCompDR-1B라는 대규모 데이터셋으로 미리 훈련되었다.

    구체적인 수치로 입증된 뛰어난 성능

    FastVLM은 텍스트가 많이 포함된 이미지를 이해하는 데 탁월한 능력을 보였다. 주요 AI 성능 평가에서 구체적인 수치로 우수성을 입증했다. GQA 일반 지식 평가에서 63.1점, 과학 문제 해결에서 81.5점, 텍스트 인식에서 62.9점, 문서 분석에서 70.4점을 기록했다.

    특히 기존에 널리 사용되던 ConvNeXT-L 모델과 비교했을 때 2.3배 빠른 속도와 1.7배 작은 크기를 달성했고, SigLIP-SO400M 모델 대비해서는 3.2배 빠른 속도와 3.6배 작은 크기를 기록했다. 토큰 프루닝이라는 기존 속도 개선 방법들과 비교해도 FastVLM이 더 나은 성능을 보였다.

    정적 해상도 방식으로 최적화, 최대 2048x2048 처리 가능

    FastVLM은 이미지를 여러 단계로 나누어 각각 다른 크기의 정보를 추출한 후 이를 종합해 최종 결과를 만든다. 연구진이 정적 해상도와 동적 해상도 방식을 비교한 결과, 이미지를 작은 조각으로 나누는 타일링 방식보다는 전체 이미지를 한 번에 처리하는 정적 방식이 더 효과적임을 발견했다.

    FastVLM은 간단한 2x2 그리드 방식을 사용해 최대 2048x2048 해상도까지 처리할 수 있다. 이는 기존 InternVL2 모델이 36개의 조각으로 나누어 처리하는 것과 달리, 단 4개의 조각만으로 고해상도 이미지를 처리할 수 있다는 의미다. 동적 해상도는 메모리 용량이 제한적인 상황에서만 유리한 것으로 나타났다.

    체계적인 훈련 과정과 대규모 데이터 활용

    FastVLM의 뛰어난 성능은 체계적인 훈련 과정에서 나온다. 2단계 또는 3단계로 나누어 훈련하는데, 첫 번째 단계에서는 이미지와 텍스트를 연결하는 부분만 학습시키고, 두 번째 단계에서는 전체 모델을 함께 훈련시킨다.

    특히 대규모 데이터를 활용한 효과가 두드러진다. 1500만 개의 이미지-텍스트 쌍으로 사전 훈련하고, 110만 개에서 1250만 개까지 다양한 크기의 지시 학습 데이터를 사용했다. 데이터 양이 증가할수록 성능도 비례해서 향상되는 것을 확인했다. 이는 FastVLM이 더 큰 모델들과 경쟁할 수 있는 기반이 되었다.

    복수 AI 모델 조합보다 단일 모델로 더 나은 성능

    최근 AI 업계에서는 여러 개의 서로 다른 AI 모델을 조합해 성능을 높이는 방식이 유행하고 있다. 하지만 FastVLM은 단일 모델만으로도 이런 복합 모델들을 능가하는 성능을 보였다. 4개의 서로 다른 AI 모델을 조합한 Cambrian-1과 비교했을 때, FastVLM이 7.9배 빠른 속도를 보이면서도 더 나은 정확도를 기록했다. 또한 MiniGemini처럼 복수의 비전 처리 기술을 사용하는 모델들과 비교해도 우수한 성능을 보였다. 이는 효율적인 단일 모델 설계가 복잡한 조합보다 더 실용적일 수 있음을 보여준다.

    동시 발표 모델들과의 치열한 경쟁에서 우위 확보

    FastVLM과 비슷한 시기에 발표된 다른 AI 모델들과의 비교에서도 경쟁력을 입증했다. SmolVLM2와 비교했을 때 8.2배 적은 정보량으로도 차트 분석과 텍스트 인식에서 더 나은 성능을 보였다. FlorenceVL과 비교해서는 2.3배 적은 정보량과 6.2배 작은 모델 크기로 문서 분석에서 우수한 결과를 달성했다. 특히 지식 기반 평가에서는 모든 경쟁 모델을 앞섰다. 가장 작은 크기의 FastVLM도 비슷한 크기의 SmolVLM2보다 4.3배 적은 정보량으로 더 나은 성능을 보여 효율성의 우수함을 입증했다.

    FAQ

    Q: FastVLM은 어떤 용도로 활용할 수 있나요?

    A: 문서나 차트가 포함된 이미지를 분석하거나, 사진 속 글자를 읽어야 하는 작업에 특히 유용합니다. 예를 들어 영수증 정보 추출, 그래프 데이터 분석, 문서 내용 요약 등에 활용할 수 있습니다.

    Q: FastVLM은 어떤 해상도까지 처리할 수 있나요?

    A: FastVLM은 최대 2048x2048 해상도까지 처리할 수 있습니다. 간단한 2x2 그리드 방식을 사용해 고해상도 이미지를 효율적으로 분석합니다.

    Q: FastVLM은 언제 실제 사용할 수 있나요?

    A: 애플은 FastVLM을 오픈소스로 공개했습니다. 연구자와 개발자들은 GitHub를 통해 코드와 모델을 다운로드하여 사용할 수 있습니다.

    해당 기사에 인용된 논문 원문은 arvix에서 확인 가능하다.

    논문 명: FastVLM: Efficient Vision Encoding for Vision Language Models

    이미지 출처: 이디오그램 생성

    해당 기사는 챗GPT와 클로드를 활용해 작성되었습니다.




    AI Matters 뉴스레터 구독하기
    태그
    AI
    안내 ?

    말 많은 뉴스

    • 1

      모니터가 그랜저 중고차 값? 1,990만 원짜리 ‘괴물’은 이게 다르다 [이 구역의 미친X]

      댓글9
      모니터가 그랜저 중고차 값? 1,990만 원짜리 ‘괴물’은 이게 다르다 [이 구역의 미친X]
    • 2

      [작전주 다나와] MSI MAG B860M 박격포 WIFI 메인보드는 지금 저점일까?

      댓글6
      [작전주 다나와] MSI MAG B860M 박격포 WIFI 메인보드는 지금 저점일까? [
    • 3

      애플은 가격을 낮추고, 샤오미는 배터리를 키웠다…요즘 IT 루머 총정리

      댓글6
      애플은 가격을 낮추고, 샤오미는 배터리를 키웠다…요즘 IT 루머 총정리
    • 4

      PS/2에서 SATA 케이블까지, PC에서 사라져가는 아재들의 추억

      댓글5
      PS/2에서 SATA 케이블까지, PC에서 사라져가는 아재들의 추억
    • 5

      [시승기] KGM 무쏘, '타스만 봤지, 오리지널 픽업 트럭이란 이런 거야'

      댓글3
      [시승기] KGM 무쏘, '타스만 봤지, 오리지널 픽업 트럭이란 이런 거야'

    일반뉴스 최신 글

    이전 페이지 1/10 다음 페이지
    • [동아게임백과사전]출시 연기한 게임치고 제대로 된 게임 없다고? 아닐걸?

      게임동아 18:09:04
      읽음 1
    • 넵튠 님블뉴런 '이터널리턴', '페르소나5 더 로열'과 컬래버레이션 진행

      게임동아 18:08:15
      읽음 1
    • 드림에이지 ‘알케론’, 신규 영상 2종 공개. 스팀 체험판 다운로드 시작

      게임동아 18:08:00
      읽음 1
    • 명조 X 컴포즈커피 세미팝업 정식 오픈

      게임동아 18:07:38
      읽음 1
    • 크릿벤처스USA, 웹3 기반 팬이코노미 플랫폼 ‘밋48’에 투자

      게임동아 18:07:24
      읽음 1
    • [겜덕연구소] 패미콤, 메가드라이브, PC엔진.. 게임기 어댑터 극성 총정리!

      게임동아 18:07:01
      읽음 1
    • 워게이밍, 스팀 배급사 할인 실시 "최대 90% 혜택 제공"

      게임동아 18:06:50
      읽음 1
    • 블리자드, '오버워치' 1시즌 '정복' 특별 이벤트 진행

      게임동아 18:05:54
      읽음 7
    • 최대 80% 저렴하게! 스토브, 2P 게임즈 특별 할인행사 진행

      게임동아 18:05:29
      읽음 5
    • ‘초월의 소환서’ 받을 기회! 컴투스 ‘서머너즈 워’ 미션 이벤트 실시

      게임동아 18:05:13
      읽음 7
    • 엠게임, 2025년 매출 917억원. 영업이익 176억으로 마무리

      게임동아 18:04:42
      읽음 10
    • [한주의게임소식] 2주 연속 상승한 ‘니케’와 벌써 흥행작 대열에 오른 '바하: 레퀴엠'

      게임동아 18:04:30
      읽음 5
    • 넥슨, 패트릭 쇠더룬드 '회장' 선임 전격 발표

      게임동아 18:04:14
      읽음 5
    • 엔씨, 타임 서바이벌 슈터 ‘타임 테이커즈’ CBT 일정 공개

      게임동아 18:03:57
      읽음 8
    • 8천여 명 몰렸다... 네오위즈 ‘피망 뉴맞고’ 오프라인 팝업 성료

      게임동아 18:03:31
      읽음 7
    • [겜덕연구소] 설정 너무한데? 깜짝 놀랄 반전을 가진 게임 주인공의 정체!!

      게임동아 18:03:12
      읽음 9
    • [겜덕연구소] 갑부집 아들 게임기 네오지오의 새로운 게임기 MVSX, 아 갈등된다

      게임동아 18:02:26
      읽음 7
    • SOOP, ASL 시즌 21 본선 앞두고 ‘ASL 시즌 오픈’ 개최

      게임동아 18:02:09
      읽음 13
    • 소니, ‘완다와 거상’ 리메이크 스튜디오 블루포인트 폐쇄... 약 70명 감축

      게임동아 18:01:28
      읽음 17
    • 라인게임즈, 방치형 신작 PC 게임 ‘햄스터 톡’ 최초 공개

      게임동아 18:01:07
      읽음 14
    • '인왕3(Nioh 3) 판매량 100만 장 돌파...시리즈 누적 1000만

      게임동아 18:00:47
      읽음 15
    • 미국 로스앤젤레스, 로블록스를 상대로 소송... “미성년자 보호 소홀하다”

      게임동아 18:00:25
      읽음 18
    • 사우디 자본 등에 업은 스코플라이, ‘픽셀 플로우’ 개발사 1조 4,493억 원에 인수

      게임동아 18:00:07
      읽음 17
    • 넷마블 '나 혼자만 레벨업:어라이즈,' '포트나이트'와 컬래버 진행

      게임동아 17:59:49
      읽음 14
    • AI뉴스 진짜 난리난 Seedance 2.0, Gemini 3 Deep, GPT5.3CodexSpark, GLM5, M2.5, Simile, AI여친 Clawra 등

      조코딩 JoCoding 17:32:03
      읽음 87
    • 서린씨앤아이, 일러스타 페스 10 예스톤 부스에 협찬 및 이벤트 진행

      다나와 17:19:18
      읽음 47
    • 디앤디컴 ‘바이오하자드 레퀴엠’ 엔비디아 게임 번들 프로모션 진행

      다나와 17:00:42
      읽음 47
    • 1stPlayer, 일러스타 페스 10서 YESTON 콜라보 부스 오픈

      다나와 17:00:04
      읽음 46
    • “7세 이하 조식 공짜”…금호리조트, 가족 여행객 잡기 승부수

      뉴스탭 16:05:27
      읽음 49
    • RTX 5090 사면 ‘레지던트이블 레퀴엠’이 공짜…게인워드, 블랙웰 번들 프로모션 돌입

      뉴스탭 16:05:21
      읽음 58 공감 1
    • “ASRock 메인보드 사면 4년 보증”…디앤디컴, 한정 프로모션 시즌2 돌입

      뉴스탭 16:05:15
      읽음 56 공감 1
    • “급찐급빠 잡아라”…하림, 해동 없는 냉장 닭가슴살로 포스트 설 시장 정조준

      뉴스탭 16:05:08
      읽음 43
    • 구글(Google) 제미나이(Gemini) 앱, AI 음악 생성 기능 품었다…"텍스트 한 줄이나 폰 앨범 동영상으로 30초 트랙을”

      AI matters 15:42:09
      읽음 42
    • '아이폰 자동차' 애플 카플레이 새 버전에 영상 스트리밍 기능 추가

      오토헤럴드 14:37:30
      읽음 53
    • 현대차·기아 전기차 ICCU 결함 글로벌 시장 확산, 신뢰도에 ‘빨간불’

      오토헤럴드 14:37:27
      읽음 60
    • '3000만원대 프리미엄 전기차' 볼보 EX30 파격 인하, 아이오닉 5보다 저렴

      오토헤럴드 14:37:24
      읽음 62
    • 포르쉐코리아, 미래 세대 ‘꿈’ 실현 ‘포르쉐 두 드림’ 10주년 사회공헌 강화

      오토헤럴드 14:37:17
      읽음 44
    • 독일 프리미엄3사 중국시장에서 판매 하락과 가격 인하

      글로벌오토뉴스 14:37:04
      읽음 49
    • 토털에너지스-구글, 텍사스서 1GW 규모 태양광 전력 공급 계약 체결

      글로벌오토뉴스 14:37:00
      읽음 46
    • 포드 CEO 짐 팔리, 트럼프 행정부에 중국과 합작 파격 제안

      글로벌오토뉴스 14:36:57
      읽음 47
    • 프랑스, 사회적 임대 열풍에 전기차 점유율 25% 돌파

      글로벌오토뉴스 14:36:54
      읽음 47
    • 테슬라 FSD, 이번엔 호수로 돌진, 무감독 주행 아직 멀었나

      글로벌오토뉴스 14:36:51
      읽음 58
    • 아우디, 디젤 엔진 부활과 물리 버튼의 귀환

      글로벌오토뉴스 14:36:48
      읽음 55
    • 샤오펑, VLA 2.0 앞세워 로보택시 출사표

      글로벌오토뉴스 14:36:45
      읽음 55
    • 중국 장청자동차, 유럽 시장 재 도전 선언… 2030년 연 30만 대 생산 공장 건설

      글로벌오토뉴스 14:36:42
      읽음 53
    • 폭스바겐코리아, 2026년 ‘Feel & Drive’ 시승 캠페인 전개

      글로벌오토뉴스 14:36:39
      읽음 44
    • 페라리, 엔초 페라리 박물관서 “최고의 걸작 – 전설적인 뮤지션과 그들의 페라리” 전시 개최

      글로벌오토뉴스 14:36:36
      읽음 43
    • 볼보자동차코리아, 순수 전기 SUV ‘EX30’ 및 ‘EX30CC’ 가격 파격 인하

      글로벌오토뉴스 14:36:33
      읽음 61
    • 한국타이어 후원, 월드 랠리 챔피언십 ‘스웨덴 랠리’ 성료

      글로벌오토뉴스 14:36:30
      읽음 39
    • 포르쉐코리아, ‘포르쉐 두 드림’ 10년차 맞아 사회공헌 캠페인 강화

      글로벌오토뉴스 14:36:27
      읽음 40
    • 답 안 나올 땐 답나와를 찾아주세요.

    • [2.10~2.23] 주연테크 Q27C15 IPS QHD USB-C 100

    • 경품이 99개! 2월 무~제한 포인트 룰렛

    스폰서 PICK

    이전 페이지 1/3 다음 페이지
    • 엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스 ES 800W 80PLUS스탠다드 ATX3.1

      엔티스
    • 잘만 ALPHA II DS A36(블랙)

      잘만 ALPHA II DS A36(블랙)

      잘만
    • 앱코 G40 시그니처(블랙)

      앱코 G40 시그니처(블랙)

      앱코
    • darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash DY470 ARGB 강화유리(화이트)

      darkFlash
    • AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD 라이젠5-5세대 7600 (라파엘)(멀티팩 정품)

      AMD
    • 앱코
    • MICRONICS
    • 잘만
    PC버전 로그인 개인정보처리방침 고객센터
    (주) 커넥트웨이브
    대표:
    김정남
    주소
    서울특별시 금천구 벚꽃로 298, 17층(가산동, 대륭포스트타워6차) / 우편번호: 08510
    • 사업자번호:
      117-81-40065
    • 통신판매업:
      제2024-서울금천-0848호
    • 부가통신사업:
      제003081호
    • 고객센터:
      1688-2470 (유료)
    • 이메일:
      cs@cowave.kr
    • 호스팅 제공자:
      (주)커넥트웨이브
    • 사업자 정보확인
    • 이용약관
    • 책임의 한계
    • 청소년 보호정책
    뒤로
    새로고침 맨위로 이동
    안내

    유용하고 재미있는 정보인가요? 공감이 된다면 공감 버튼을,
    그렇지 않다면 비공감 버튼을
    눌러 주세요!
    공감이나 비공감을 선택 하는 경우
    다나와 포인트를 적립해 드립니다.
    ※ 공감 버튼의 총 선택 횟수는
    전체 공개입니다.
    비공감 버튼의 선택 여부는
    선택한 본인만 알 수 있습니다.

    포인트 안내
    목록
    공감 3
    비공감
    댓글
    공유

    공유받은 친구가 활동하면 포인트를!

    URL이 복사되었습니다.

    공유하기

    레이어 닫기

    지금 보는 페이지가 마음에 든다면
    공유하기를 통해 지인에게 소개해 주세요.

    • 카카오톡
    • 라인
    • 페이스북
    • X
    • 밴드
    https://dpg.danawa.com/mobile/news/view?boardSeq=60&listSeq=5862160 복사

    로그인 유저에게는 공유 활동에 따라
    다나와 포인트가 지급됩니다.

    자세히 >

    URL이 복사되었습니다.