비교하고 잘 사는, 다나와 : 가격비교 사이트

다나와 앱
다나와 앱 서비스 목록
다나와 APP
다나와 가격비교 No.1 가격비교사이트 다나와 앱으로
간편하게 최저가를 확인하세요.
- -
QR코드
빈 이미지
다나와 앱 서비스 목록 닫기

구글, ‘팔리젬마2’ 공개… 시각-언어 처리의 새 지평 연다

2024.12.11. 12:40:45
조회 수
313
6
댓글 수
1

공유하기

레이어 닫기

지금 보는 페이지가 마음에 든다면
공유하기를 통해 지인에게 소개해 주세요.

로그인 유저에게는 공유 활동에 따라
다나와 포인트가 지급됩니다.

자세히 >

URL이 복사되었습니다.
원하는 곳에 붙여넣기(Ctrl+V)하세요.

레이어 닫기

구글(Google)이 5일(현지시간) 시각과 언어를 함께 처리할 수 있는 AI 모델 '팔리젬마2(PaliGemma 2)'를 공개했다. 구글 개발자 블로그에 따르면, 팔리젬마2는 지난 5월 출시된 젬마(Gemma) 제품군의 첫 번째 시각-언어 모델인 팔리젬마의 후속 버전이다. 구글은 "고급 시각 AI를 더욱 접근하기 쉽게 만들기 위한 중요한 진전"이라고 설명했다.

팔리젬마2는 젬마2 모델을 기반으로 시각적 능력을 추가했다. 3가지 모델 크기(3B, 10B, 28B 파라미터)와 3가지 해상도(224px, 448px, 896px)를 지원해 작업별 최적화가 가능하다. 이미지 설명 생성 능력이 크게 향상되어 단순한 객체 인식을 넘어 행동, 감정, 전반적인 장면의 맥락까지 상세히 설명할 수 있다. 화학식 인식, 악보 인식, 공간 추론, 흉부 X-ray 리포트 생성 등 새로운 영역에서도 우수한 성능을 보인다.

젬마 제품군은 출시 이후 수만 개의 모델과 응용 프로그램이 개발되며 '젬마버스'라는 생태계를 형성했다. 콜팔리(ColPali)의 시각적 문서 검색 발전, 로보플로우(RoboFlow)의 파인튜닝 기술, 실시간 객체 추적 등의 혁신 사례들이 젬마버스의 가능성을 보여주고 있다.

기존 팔리젬마 사용자들은 대부분의 작업에서 코드 수정 없이 즉각적인 성능 향상을 경험할 수 있다. 또한 특정 작업과 데이터셋에 맞춘 파인튜닝도 쉽게 할 수 있다.

개발자들은 다음과 같은 방법으로 팔리젬마2를 시작할 수 있다:

  1. 허깅페이스(Hugging Face)와 캐글(Kaggle)에서 사전 학습된 모델과 코드 다운로드
  2. 포괄적인 문서와 예제 노트북을 통한 학습 및 통합
  3. 허깅페이스 트랜스포머(Hugging Face Transformers), 케라스(Keras), 파이토치(PyTorch), JAX, 젬마.cpp(Gemma.cpp) 등 선호하는 프레임워크 활용

구글은 팔리젬마2를 통해 개발자들이 더 많은 혁신을 이룰 것으로 기대하며, 젬마 커뮤니티 참여와 젬마버스에서의 프로젝트 공유를 장려하고 있다. 또한 이러한 피드백과 기여가 모델의 미래를 형성하고 AI 분야의 혁신을 주도하는 데 중요하다고 강조했다.

PaliGemma 2에 대한 자세한 사항은 구글에서 확인할 수 있다.

기사는 클로드 3.5 Sonnet과 챗GPT-4o를 활용해 작성되었습니다. 




AI Matters 뉴스레터 구독하기

공감/비공감

공감/비공감안내도움말 보기
유용하고 재미있는 정보인가요?
공감이 된다면 공감 버튼을, 그렇지 않다면 비공감 버튼을 눌러 주세요!
공감이나 비공감을 선택 하는 경우 다나와 포인트를 적립해 드립니다. ※ 공감 버튼의 총 선택 횟수는 전체 공개입니다. 비공감 버튼의 선택 여부는 선택한 본인만 알 수 있습니다.
최신 일반뉴스 전체 둘러보기
1/1
[오늘의 스팀] 간만의 무협 수작, 연운 ‘매우 긍정적’ 게임메카
엔트런스 ‘DK모바일 리본’, 플레이 중심의 경제 서버 ‘번영의 월드’ 사전예약 시작 게임동아
글로벌 돌풍 ‘메이플 키우기’, 첫 번째 업데이트 '신규 파티 퀘스트' 진행 게임동아
어둠의전설, ‘나겔링탑 확장’ 업데이트 실시 게임동아
‘테일즈위버’. 신규 챕터 외전 6 Part.2 업데이트 게임동아
배그와 배그 모바일, 태국에서 e스포츠로 전격 컬래버 게임메카
"기술에서 친구로" 고독·고립 시대 빈자리 채우는 AI 컴패니언 앱 IT동아
"오픈AI 피싱 메일 주의"… 오픈AI, 해킹으로 API 사용자 정보 유출 (1) AI matters
"눈으로 보고, 글로 계산"… AI 추론 능력 끌어올리는 해법 찾았다 AI matters
"여기 어디야?" 사진 한 장에 위치 맞추는 AI 등장… 간판, 건물 모양, 표지판 분석해 장소 찾는다 AI matters
건설 현장 사망사고 20%가 '추락'… AI가 안전모 미착용까지 잡아낸다 (1) AI matters
오픈AI, 10대 자살 소송에 "이용약관 위반한 이용자 책임" 반박… 논란 가열 AI matters
"효율화"라는 이름의 칼바람… 테크 업계, AI·자동화 도입으로 2025년 월 2천~2만명대 감원 (1) AI matters
오픈AI "기업 데이터, 원하는 국가에 저장하세요"… 한국 포함 10개국에 ‘데이터 레지던스’ 서비스 시작 (1) AI matters
엔비디아 CEO "AI 덜 쓰라고? 제정신이야?"… 내부 회의 녹음 유출 AI matters
현대차 싼타페 '필요한 순간 작동 멈추는 후방카메라' 14만 대 리콜 (1) 오토헤럴드
기아, 국내 최초 일반 도로 원격 운전 성공 '70시간, 1000km 사전 주행' (1) 오토헤럴드
내가 줄인 탄소, 왜 정부가 가져가나… 전기차 배출권 논쟁 글로벌오토뉴스
기아, 국내 최초 일반 도로 원격 운전 실증 성공 글로벌오토뉴스
‘내맘대로 지구별’ 16주년 생일 맞아 ‘16주년 대축제’ 시작 (1) 게임동아
이 시간 HOT 댓글!
1/4