비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

구글, ‘팔리젬마2’ 공개… 시각-언어 처리의 새 지평 연다

2024.12.11. 12:40:45
조회 수
168
6
댓글 수
1

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

구글(Google)이 5일(현지시간) 시각과 언어를 함께 처리할 수 있는 AI 모델 '팔리젬마2(PaliGemma 2)'를 공개했다. 구글 개발자 블로그에 따르면, 팔리젬마2는 지난 5월 출시된 젬마(Gemma) 제품군의 첫 번째 시각-언어 모델인 팔리젬마의 후속 버전이다. 구글은 "고급 시각 AI를 더욱 접근하기 쉽게 만들기 위한 중요한 진전"이라고 설명했다.

팔리젬마2는 젬마2 모델을 기반으로 시각적 능력을 추가했다. 3가지 모델 크기(3B, 10B, 28B 파라미터)와 3가지 해상도(224px, 448px, 896px)를 지원해 작업별 최적화가 가능하다. 이미지 설명 생성 능력이 크게 향상되어 단순한 객체 인식을 넘어 행동, 감정, 전반적인 장면의 맥락까지 상세히 설명할 수 있다. 화학식 인식, 악보 인식, 공간 추론, 흉부 X-ray 리포트 생성 등 새로운 영역에서도 우수한 성능을 보인다.

젬마 제품군은 출시 이후 수만 개의 모델과 응용 프로그램이 개발되며 '젬마버스'라는 생태계를 형성했다. 콜팔리(ColPali)의 시각적 문서 검색 발전, 로보플로우(RoboFlow)의 파인튜닝 기술, 실시간 객체 추적 등의 혁신 사례들이 젬마버스의 가능성을 보여주고 있다.

기존 팔리젬마 사용자들은 대부분의 작업에서 코드 수정 없이 즉각적인 성능 향상을 경험할 수 있다. 또한 특정 작업과 데이터셋에 맞춘 파인튜닝도 쉽게 할 수 있다.

개발자들은 다음과 같은 방법으로 팔리젬마2를 시작할 수 있다:

  1. 허깅페이스(Hugging Face)와 캐글(Kaggle)에서 사전 학습된 모델과 코드 다운로드
  2. 포괄적인 문서와 예제 노트북을 통한 학습 및 통합
  3. 허깅페이스 트랜스포머(Hugging Face Transformers), 케라스(Keras), 파이토치(PyTorch), JAX, 젬마.cpp(Gemma.cpp) 등 선호하는 프레임워크 활용

구글은 팔리젬마2를 통해 개발자들이 더 많은 혁신을 이룰 것으로 기대하며, 젬마 커뮤니티 참여와 젬마버스에서의 프로젝트 공유를 장려하고 있다. 또한 이러한 피드백과 기여가 모델의 미래를 형성하고 AI 분야의 혁신을 주도하는 데 중요하다고 강조했다.

PaliGemma 2에 대한 자세한 사항은 구글에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
광주 광산구, 친환경 대중골프장 '광산CC' 조기 인수 추진 연합뉴스
데이터센터 에너지 소비부터 여성 AI 인력까지, 딜로이트가 꼽은 2025년 생성형AI의 과제들 AI matters
AI로 기업 지식 관리하니 업무 효율 72% 향상...97%는 '필수' 인정 AI matters
AI가 정신건강 진단을 돕는다...정확도 100% 달성한 하이브리드 진단시스템 개발 AI matters
"MZ 세대 주머니 꽉 닫았다" 작년 신차 판매 2013년 이후 최저 오토헤럴드
AI가 바꾸는 고객서비스의 미래: AI가 이끄는 CX 혁신 10가지 AI matters
타타대우모빌리티, 판매 네트워크 공격적 확장... 2월 5개소 신규 오픈 오토헤럴드
현대차, 작년 영업이익 5.9% 감소... 연간 배당 주당 1만 2000원 오토헤럴드
르노그룹 '인터내셔널 게임 플랜' 적중, 작년 1.3%증가한 226만대 기록 오토헤럴드
[영상] 레벨 2부터 레벨 3까지, 자율주행의 대중화 시점은 언제? 글로벌오토뉴스
현대차, 2024년 4분기 실적 발표… 매출 46조 원, 영업이익 2.8조 원 기록 (1) 글로벌오토뉴스
르노 그룹, 한국 시장 판매량 증가 비롯해 2024년 전 세계 시장에서 226만 대 판매 글로벌오토뉴스
AI가 주도하는 산업혁명, 현실이 된 '기계의 시대' …AI 성장의 6가지 동력은? AI matters
밀레니얼 세대가 AI 혁명을 주도하는 3가지 이유... AI 업무 활용률 최대 45% 기록 AI matters
엔비디아 보고서, 유통업계 절반 이상 AI ‘6개 이상’ 활용 중... 2025년 유통업계 AI 투자 97% 증가 전망 AI matters
앤트로픽, 클로드에 ‘음성 채팅’ 기능 출시 예고... AI 챗봇 경쟁 본격화 AI matters
링크드인, 프리미엄 회원 개인 메시지로 AI 학습 논란... "30만원대 유료회원 정보도 무단 활용" AI matters
KPGA 노동조합, 직원 대상 가혹행위 한 임원 경찰에 신고 연합뉴스
해긴, '플레이투게더' 을사년 맞이 업데이트 게임동아
넷마블 '모두의마블' 설 기념 이마트 24 프로모션 게임동아
이 시간 HOT 댓글!
1/4