비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

구글, ‘팔리젬마2’ 공개… 시각-언어 처리의 새 지평 연다

2024.12.11. 12:40:45
조회 수
245
6
댓글 수
1

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

구글(Google)이 5일(현지시간) 시각과 언어를 함께 처리할 수 있는 AI 모델 '팔리젬마2(PaliGemma 2)'를 공개했다. 구글 개발자 블로그에 따르면, 팔리젬마2는 지난 5월 출시된 젬마(Gemma) 제품군의 첫 번째 시각-언어 모델인 팔리젬마의 후속 버전이다. 구글은 "고급 시각 AI를 더욱 접근하기 쉽게 만들기 위한 중요한 진전"이라고 설명했다.

팔리젬마2는 젬마2 모델을 기반으로 시각적 능력을 추가했다. 3가지 모델 크기(3B, 10B, 28B 파라미터)와 3가지 해상도(224px, 448px, 896px)를 지원해 작업별 최적화가 가능하다. 이미지 설명 생성 능력이 크게 향상되어 단순한 객체 인식을 넘어 행동, 감정, 전반적인 장면의 맥락까지 상세히 설명할 수 있다. 화학식 인식, 악보 인식, 공간 추론, 흉부 X-ray 리포트 생성 등 새로운 영역에서도 우수한 성능을 보인다.

젬마 제품군은 출시 이후 수만 개의 모델과 응용 프로그램이 개발되며 '젬마버스'라는 생태계를 형성했다. 콜팔리(ColPali)의 시각적 문서 검색 발전, 로보플로우(RoboFlow)의 파인튜닝 기술, 실시간 객체 추적 등의 혁신 사례들이 젬마버스의 가능성을 보여주고 있다.

기존 팔리젬마 사용자들은 대부분의 작업에서 코드 수정 없이 즉각적인 성능 향상을 경험할 수 있다. 또한 특정 작업과 데이터셋에 맞춘 파인튜닝도 쉽게 할 수 있다.

개발자들은 다음과 같은 방법으로 팔리젬마2를 시작할 수 있다:

  1. 허깅페이스(Hugging Face)와 캐글(Kaggle)에서 사전 학습된 모델과 코드 다운로드
  2. 포괄적인 문서와 예제 노트북을 통한 학습 및 통합
  3. 허깅페이스 트랜스포머(Hugging Face Transformers), 케라스(Keras), 파이토치(PyTorch), JAX, 젬마.cpp(Gemma.cpp) 등 선호하는 프레임워크 활용

구글은 팔리젬마2를 통해 개발자들이 더 많은 혁신을 이룰 것으로 기대하며, 젬마 커뮤니티 참여와 젬마버스에서의 프로젝트 공유를 장려하고 있다. 또한 이러한 피드백과 기여가 모델의 미래를 형성하고 AI 분야의 혁신을 주도하는 데 중요하다고 강조했다.

PaliGemma 2에 대한 자세한 사항은 구글에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
호이, PGA 투어 배러쿠다 챔피언십 2R 단독 선두 연합뉴스
국내 야간 영업 골프장 238곳…4년 전 대비 72개소 증가 연합뉴스
미세하게 움직인 공…라우리, 디오픈서 통한의 '2벌타' 연합뉴스
임성재, 디오픈 2R 공동 34위…한국 선수 유일하게 생존 연합뉴스
'아이디어를 시제품제작과 현실 창업으로'··· 서울과기대 학생창업 여정 취재기 IT동아
업스테이지 솔라 프로2 써보니··· '독보적인 OCR 인식률· API 확장성 인상적' IT동아
UAE, 엔비디아 AI 칩 구매 계약 보류… 美 "중국 유출 우려" AI matters
스레드에 AI 기능 도입되나… 메타, 생성형 AI 제품 부사장 ‘스레드 총괄 책임자’로 임명 AI matters
“실감형 미디어 콘텐츠 자동 생성”… 네이버, AI-XR 결합한 '비전 테크 트라이앵글' 공개 AI matters
“사용자 공지 없었다” 앤트로픽, 클로드 코드 사용량 제한 강화 및 변경 논란 AI matters
“명령 한 번에 여러 파일 동시 수정” 구글, 제미나이 코드 어시스트 ‘AI 에이전트’ 모드 출시 AI matters
과기정통부, AI 휴머노이드 핵심기술 개발에 5년간 216억 원 투입한다 AI matters
“사자 포효 소리부터 자연 환경음까지”... 어도비, AI 효과음 제작하는 신기능 베타 출시 AI matters
넷플릭스, 오리지널 드라마에 생성형 AI 최초 활용… “건물 무너지는 장면 구현” AI matters
MSI코리아, 20일 'MSI RTX 50 시리즈 AI 노트북 팝업스토어' 운영 다나와
MSI '2025 상반기 다나와 히트브랜드 팝업 행사' 참가 다나와
트럼프 대통령, “AI·에너지 인프라에 900억 달러 투자”…미국 산업 재건 본격화 (1) 다나와
KPGA 김태우, 챌린지 투어 첫 우승 연합뉴스
현대차, 차량 내비게이션에 '구글 플레이스' 통합…고객 편의성 대폭 강화 글로벌오토뉴스
테슬라 로보택시, 법적 책임 논란 가열…사고시 책임 소재 문제 본격 점화 (1) 글로벌오토뉴스
이 시간 HOT 댓글!
1/4