
구글이 17일(현지 시간) 자사 개발자 블로그를 통해 기존 2.0 플래시의 기반 위에 추론 능력을 대폭 강화한 제미나이(Gemini) 2.5 플래시를 API를 통해 공개했다. 이번 모델은 속도와 비용 효율성을 유지하면서도 향상된 추론 능력을 제공하는 첫 완전 하이브리드 추론 모델로, 개발자들이 추론 기능을 켜고 끌 수 있는 유연성을 갖추었다.
제미나이 2.5 모델은 응답하기 전에 생각을 통해 추론할 수 있는 '생각하는 모델'이다. 단순히 출력을 즉시 생성하는 대신, 프롬프트를 더 잘 이해하고 복잡한 작업을 분해하며 응답을 계획하는 '생각' 과정을 수행한다. 수학 문제 해결이나 연구 질문 분석과 같은 여러 단계의 추론이 필요한 복잡한 작업에서, 이 생각 과정은 모델이 더 정확하고 포괄적인 답변에 도달하도록 돕는다. 구글 블로그에 따르면, 제미나이 2.5 플래시는 LMArena의 어려운 프롬프트에서 2.5 프로에 이어 두 번째로 강력한 성능을 보인다고 한다.
이번에 출시된 제미나이 2.5 플래시는 최고의 가격 대비 성능 비율을 자랑하는 모델이다. 비교 표에 따르면, 2.5 플래시는 다른 선도적인 모델들과 비슷한 성능을 보이면서도 훨씬 작은 비용과 크기를 제공한다. 구글은 "제미나이 2.5 플래시가 구글의 비용 대비 품질의 파레토 프론티어에 또 하나의 모델을 추가했다"고 설명했다.
제미나이 2.5 플래시는 개발자들에게 모델이 생각하는 동안 생성할 수 있는 최대 토큰 수에 대한 세밀한 제어 기능을 제공한다. 더 높은 예산을 설정하면 모델이 품질을 향상시키기 위해 더 깊이 추론할 수 있다. 중요한 점은 이 예산이 2.5 플래시가 생각할 수 있는 상한선을 설정하지만, 프롬프트가 요구하지 않는 경우 모델은 전체 예산을 사용하지 않는다.
모델은 주어진 프롬프트에 대해 얼마나 오래 생각해야 하는지 알도록 훈련되어 있으며, 인식된 작업 복잡성에 따라 자동으로 얼마나 생각할지 결정한다. 만약 2.0 플래시보다 성능을 향상시키면서도 최저 비용과 지연 시간을 유지하고 싶다면, 생각 예산을 0으로 설정할 수 있다. API의 매개변수나 구글 AI 스튜디오(Google AI Studio)와 버텍스 AI(Vertex AI)의 슬라이더를 사용하여 생각 단계에 대한 특정 토큰 예산을 설정할 수도 있다. 2.5 플래시의 예산 범위는 0에서 24576 토큰까지다.
생각 능력을 갖춘 제미나이 2.5 플래시는 이제 구글 AI 스튜디오와 버텍스 AI의 제미나이 API를 통해, 그리고 제미나이 앱의 전용 드롭다운에서 미리보기로 사용할 수 있다. 구글은 개발자들이 thinking_budget 매개변수를 실험하고 제어 가능한 추론이 더 복잡한 문제를 해결하는 데 어떻게 도움이 될 수 있는지 탐색할 것을 권장했다. 구글은 앞으로도 제미나이 2.5 플래시를 계속 개선할 예정이며, 전체 프로덕션 사용을 위한 일반 가용성을 제공하기 전에 더 많은 기능을 추가할 계획이다.
해당 모델에 대한 자세한 사항은 링크에서 확인할 수 있다.
이미지 출처: 구글 개발자 블로그
기사는 클로드와 챗gpt를 활용해 작성되었습니다.
AI Matters 뉴스레터 구독하기