[출처 : 구글 블로그]
돌고래와 인간 간의 대화, 현실이 될까? 구글이 개발한 대규모 언어 모델 '돌핀젬마(DolphinGemma)’가 돌고래의 소통 방식을 분석하며 과학자들의 꿈에 한 걸음 더 다가가고 있다.
구글이 돌고래의 언어를 해독하기 위한 인공지능(AI) 모델을 개발해 눈길을 끌고 있다. ‘돌핀젬마(DolphinGemma)’라는 이름의 이 모델은 조지아공대와 야생 돌고래 연구기관인 ‘WDP(Wild Dolphin Project)’와의 협업을 통해 만들어졌으며, 실제 현장에 투입돼 돌고래의 소리를 분석하고 이해하려는 시도가 진행 중이다.
WDP는 1985년부터 바하마 해역에서 야생 대서양 점박이돌고래(Stenella frontalis)를 관찰해온 세계 최장기 수중 돌고래 연구 프로젝트다. 수십 년에 걸쳐 수집된 음성, 영상 자료는 개별 돌고래의 신원, 생애 이력, 사회적 행동과 함께 정리되어 있어 AI 학습에 최적의 데이터를 제공한다.
돌고래는 휘파람, 클릭음, 버스트 펄스 등 다양한 소리를 통해 서로 소통하는데, 연구진은 특정 소리가 어떤 행동과 연결되는지를 오랜 시간 추적해왔다. 예를 들어, 어미와 새끼는 서로를 부를 때 고유한 휘파람을 사용하고, 싸움 중에는 날카로운 ‘스콰크’, 구애나 상어를 쫓을 땐 짧은 클릭음을 낸다.
(좌) 어미 점박이 돌고래가 먹이를 찾는 동안 새끼를 관찰하고 있다. 어미는 새끼가 먹이를 다 먹으면 특유의 휘파람을 불어 새끼를 다시 불러들인다. (우) 휘파람 소리를 시각화하기 위한 스펙트로그램
[출처 : 구글 유튜브]
이처럼 복잡한 소통 체계를 해석하려면 막대한 시간과 노력이 필요하다. 구글은 이를 해결하기 위해 ‘돌핀젬마'를 개발했다. 이 모델은 사람의 언어를 이해하는 언어 모델처럼, 돌고래의 음성 패턴을 분석하고 그 다음 나올 소리를 예측하는 방식으로 작동한다. 약 4억 개의 파라미터로 구성된 이 모델은 Pixel 스마트폰에서 바로 실행될 수 있도록 설계되어 현장 연구에 실시간으로 활용된다.
WDP는 현재 돌고래의 자연스러운 소리를 분석하는 것 외에도, AI를 이용한 ‘양방향 소통’ 가능성도 시험 중이다. CHAT(Cetacean Hearing Augmentation Telemetry)라는 이름의 시스템을 통해 돌고래가 좋아하는 물체에 인공 휘파람을 대응시켜 가르치고, 이를 돌고래가 흉내내면 사람이 반응해주는 방식이다.
[출처 : Georgia Tech College of Computing 유튜브]
이 시스템에는 Pixel 스마트폰이 중심 장비로 사용되며, 곧 차세대 모델인 Pixel 9을 활용한 업그레이드도 계획 중이다. 특히 ‘돌핀젬마'의 예측 능력은 돌고래의 소리 패턴을 빠르게 인식하고, 연구자가 이에 더 민첩하게 반응할 수 있도록 도와준다. AI의 힘을 빌려 돌고래와의 소통을 더 자연스럽고 효과적으로 만들 수 있는 것이다.
구글은 오는 여름, ‘돌핀젬마'를 오픈소스로 공개할 예정이며, 이를 통해 전 세계 해양 생물학자들이 다양한 돌고래 종의 소리를 연구하는 데 활용할 수 있도록 지원할 계획이다.
글 / 홍정민 news@cowave.kr
(c) 비교하고 잘 사는, 다나와 www.danawa.com