최근 인공지능(AI) 챗봇 서비스 챗GPT가 고급 음성 모드의 대대적인 업데이트를 진행하면서 사용자들의 관심이 뜨겁다. 오픈AI는 이번 업데이트를 통해 사용자와 AI 간 대화의 자연스러움을 획기적으로 개선했다고 밝혔다.
새롭게 업그레이드된 고급 음성 모드는 사용자가 생각을 정리하거나 말을 고르는 동안에도 성급하게 대화에 끼어들지 않고 기다리는 등 사람과 유사한 상호작용을 구현했다. 특히 한국어 사용자들을 위한 지원도 강화되었는데, 한국어 특유의 억양과 심지어 사투리까지 자연스럽게 이해하고 반응할 수 있게 되어 더욱 친근한 경험을 제공한다는 평가다.
한편, 이번 음성 모드 업데이트는 AI 비서 시장 내 치열한 경쟁 속에서 이루어졌다. 아마존은 최근 생성형 AI 기능을 탑재한 ‘알렉사 플러스’를 발표했고, 구글 또한 개인 맞춤형 AI 어시스턴트인 ‘제미나이 라이브’를 선보이며 적극적으로 시장 확대에 나서고 있다.
챗GPT는 음성 모드 개선 외에도 실시간 영상 이해 기능을 추가했다. 사용자는 스마트폰 카메라로 주변을 비추는 것만으로 챗GPT가 사물과 환경을 인식해 관련 정보를 즉각 제공받을 수 있게 되었다. 이를 통해 더욱 직관적이고 효율적인 대화가 가능해졌다는 반응이 이어지고 있다.
그러나 긍정적인 평가에도 불구하고 한계점도 지적된다. 일부 사용자들은 멀티모달 기능 지원이 여전히 제한적이며, 서비스의 글로벌 출시가 당초 계획보다 한 달가량 지연된 점을 아쉬움으로 꼽았다. 오픈AI 측은 콘텐츠 관리와 시스템 안정성 확보를 위한 불가피한 결정이었다고 해명하며, 곧 모든 사용자에게 안정적으로 제공할 예정이라고 밝혔다.
이번 업데이트로 챗GPT의 고급 음성 모드는 외국어 학습, 실시간 통역, 발음 교정 등 다양한 분야에서 활용 가능성이 커지면서 향후 AI 음성 비서 시장에서의 경쟁력을 한층 끌어올릴 것으로 기대된다.
글 / 한만수 news@cowave.kr
(c) 비교하고 잘 사는, 다나와 www.danawa.com