구글 번역(Google Translate)은 스마트폰이나 PC에서 오프라인 상태로도 이용할 수 있고 100개가 넘는 언어를 지원한다. 구글이 이런 자사의 번역 서비스인 구글 번역 10주년을 맞아 자연스러운 번역을 가능하게 하는 인공지능을 활용한 GNMT 시스템을 발표했다.
인공지능 연구를 위해 여러 주요 IT 기업과 제휴를 맺어온 구글이 인공지능을 구사한 번역 시스템인 GNMT(Google Neural Machine Translation)를 발표한 것. 구글 번역에선 지금까지 문장 기반 기계번역인 PBMT라는 시스템이 쓰여왔다. 하지만 이렇게 단어와 구문마다 기계적으로 문장을 번역하는 방법이 아니라 문장 전체를 하나의 번역 단위로 파악할 수 있는 게 바로 GNMT다.
구글에 따르면 GNMT가 문장 전체를 하나의 번역 단위로 파악해 접근할 때 생기는 장점은 공학적 설계 선택이 기존 PBMT보다 적다는 것이라고 한다. 실제로 GNMT를 구사한 첫 번역에선 기존 구글 번역과 손색없는 번역 정확도를 보였다고 한다. 또 여러 번 번역을 거듭하면 GNMT는 뛰어난 번역과 빠른 번역 속도 양립이 가능하다고 한다. 구글에 따르면 GNMT를 이용한 구글 번역은 번역 오류를 55∼85%나 줄일 수 있게 된다.
구글에 따르면 GNMT는 일부는 인간 수준 번역이 가능한 수준에 도달했다고 한다. 그래프를 보면 GNMT와 PBMT간 번역을 6단계로 평가해 비교한 게 나온다. 가장 번역 정확도가 높은 건 인간 번역. 하지만 불어를 영어로 번역하거나 영어를 스페인어로 변역하면 인간과 GNMT 사이에는 그다지 큰 차이를 보이지 않는다.
GNMT가 중국어를 영어로 변역하는 과정을 시각화한 걸 보면 먼저 GNMT 네트워크는 중국어 단어를 벡터 목록에 인코딩한다. 각 벡터는 단어는 여기까지 읽힌 것을 나타낸다. 번역 문장을 모두 읽은 뒤에는 디코더가 영어 문장을 단어 단위로 생성하기 시작한다. 또 중국어 문장을 PBMT와 GNMT, 인간 3가지 패턴으로 실제 번역한 결과를 비교해봐도 PBMT보다 GNMT 쪽이 훨씬 더 자연스러운 문장에 가까워졌다는 걸 알 수 있다.
구글은 GNMT 정확도를 높이기 위해 중국어를 영어 번역 한정으로 구글 번역에 GNMT 구현했다고 한다. 중국에서 영어 번역은 웹버전과 모바일 버전을 합치면 매일 1,800만 건 가량이 발생한다고 한다. 이들은 모두 GNMT로 처리하고 있다는 것. 앞으로 몇 개월 이내에 다른 언어 번역에도 GNMT를 이용할 계획이라고 한다. 구글의 GNMT 관련 연구에 대한 내용은 논문으로도 활인할 수 있다. 관련 내용은 이곳에서 확인할 수 있다.
<저작권자(c) 테크홀릭(http://www.techholic.co.kr/). 무단전재-재배포금지>