비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

구글, ‘팔리젬마2’ 공개… 시각-언어 처리의 새 지평 연다

2024.12.11. 12:40:45
조회 수
267
6
댓글 수
1

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

구글(Google)이 5일(현지시간) 시각과 언어를 함께 처리할 수 있는 AI 모델 '팔리젬마2(PaliGemma 2)'를 공개했다. 구글 개발자 블로그에 따르면, 팔리젬마2는 지난 5월 출시된 젬마(Gemma) 제품군의 첫 번째 시각-언어 모델인 팔리젬마의 후속 버전이다. 구글은 "고급 시각 AI를 더욱 접근하기 쉽게 만들기 위한 중요한 진전"이라고 설명했다.

팔리젬마2는 젬마2 모델을 기반으로 시각적 능력을 추가했다. 3가지 모델 크기(3B, 10B, 28B 파라미터)와 3가지 해상도(224px, 448px, 896px)를 지원해 작업별 최적화가 가능하다. 이미지 설명 생성 능력이 크게 향상되어 단순한 객체 인식을 넘어 행동, 감정, 전반적인 장면의 맥락까지 상세히 설명할 수 있다. 화학식 인식, 악보 인식, 공간 추론, 흉부 X-ray 리포트 생성 등 새로운 영역에서도 우수한 성능을 보인다.

젬마 제품군은 출시 이후 수만 개의 모델과 응용 프로그램이 개발되며 '젬마버스'라는 생태계를 형성했다. 콜팔리(ColPali)의 시각적 문서 검색 발전, 로보플로우(RoboFlow)의 파인튜닝 기술, 실시간 객체 추적 등의 혁신 사례들이 젬마버스의 가능성을 보여주고 있다.

기존 팔리젬마 사용자들은 대부분의 작업에서 코드 수정 없이 즉각적인 성능 향상을 경험할 수 있다. 또한 특정 작업과 데이터셋에 맞춘 파인튜닝도 쉽게 할 수 있다.

개발자들은 다음과 같은 방법으로 팔리젬마2를 시작할 수 있다:

  1. 허깅페이스(Hugging Face)와 캐글(Kaggle)에서 사전 학습된 모델과 코드 다운로드
  2. 포괄적인 문서와 예제 노트북을 통한 학습 및 통합
  3. 허깅페이스 트랜스포머(Hugging Face Transformers), 케라스(Keras), 파이토치(PyTorch), JAX, 젬마.cpp(Gemma.cpp) 등 선호하는 프레임워크 활용

구글은 팔리젬마2를 통해 개발자들이 더 많은 혁신을 이룰 것으로 기대하며, 젬마 커뮤니티 참여와 젬마버스에서의 프로젝트 공유를 장려하고 있다. 또한 이러한 피드백과 기여가 모델의 미래를 형성하고 AI 분야의 혁신을 주도하는 데 중요하다고 강조했다.

PaliGemma 2에 대한 자세한 사항은 구글에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
[포토] 도쿄게임쇼 넥슨 부스를 지키고 있는 '베요네타' 게임메카
PC 리니지 '변신 시스템 리뉴얼' 예고에, 유저들 '술렁' 게임메카
2025 LCK 우승컵은 어디로? 결승전 28일 열린다 게임메카
고오쓰보다 재밌다, 고스트 오브 요테이 메타 87점 게임메카
이제 나도 컬래버 맛집? 팰월드, 원스 휴먼과 컬래버 게임메카
헛되지 않은 지옥의 명성, 하데스 2 메타크리틱 95점 게임메카
[오늘의 스팀] 엔씨 ‘호연’ 글로벌 평가, 대체로 부정적 게임메카
AI 대부들의 진짜 속마음... 챗GPT 이후 기술 우선주의 vs 신중론 대립 AI matters
“AI는 도우미일 때만 환영"... 2011~2025년까지 AI에 대한 대중 인식 연구 AI matters
쥐의 ‘뇌’ 학습한 AI, 인간 행동까지 예측한다... 과연 인간의 뇌를 이해한 걸까? AI matters
AI가 만든 정치 성향별 가짜 뉴스, 기존 탐지 프로그램들 절반 수준으로 성능 저하시켜 AI matters
챗GPT 등 AI 모델, 53% 확률로 실험 의도 간파... 사회 실험 결과 신뢰도 ‘빨간불’ AI matters
네오위즈 '신 천상비', '新전광석화' 서버 열고 고속 성장 지원 게임동아
2025 LCK 파이널 27일-28일 진행, LCK 사상 첫 단일 챔피언이 결정된다 게임동아
위메이드, 신작 FPS '블랙 벌처스' 스팀 2차 테스트 돌입 게임동아
컴투스홀딩스, '스피릿 테일즈'에 신규 클래스 '거너' 추가 게임동아
넥슨 ‘메이플스토리M’ 군단장 4종 카오스 난이도, 싱글 모드로 즐길 수 있다 게임동아
L&K ‘붉은보석’, 역대 최장 연휴에 즐기기 좋은 한가위 이벤트 실시 게임동아
"월드 프리미어, 커세어 뱅가드 96 키보드 & 노바블레이드 프로 - 게이밍 콘트롤러", 커세어 게이밍 키보드 발표회 (1) 브레인박스
삼성전자, AI 업무 생산성 측정 지표 '트루벤치' 공개… 실무 환경 적극 반영 AI matters
이 시간 HOT 댓글!
1/4