” 해외 세미나 발표를 위해 연설문을 구글 번역기로 돌려봤다.
이건 뭐 내가 발로 번역하는 게 더 낫겠다 싶은 수준이다.
일일이 내가 직접 번역하려 하니 머리가 급 아파졌다. “
.
구글 번역기를 사용해보신 분이라면 한번쯤 이런 경험을 하신 적이 있으실 겁니다. ‘돼지 주물럭’을 ‘Massage Pork’로, ‘육회’를 ‘six times’로, 그리고 ‘Time flies like an arrow.’라는 문장을 ‘시간파리는 화살을 좋아한다.’로 번역하는 도구에 의지하느니, 차라리 어설픈 영어실력으로라도 본인이 직접 번역하는 것이 더 나았던 그러한 경험을요. 인터넷 번역 도구들은 이때까지만 해도 전문적으로 활용되지 못했습니다. 분명 한국말이지만 한국말이 아닌 그러한 번역들을 보면 전문성 있는 도구로 인정받긴 어려웠죠.
.
| 출처 동아일보 |
(중국 원난성 리장시와 허난성 타이항산에 잘못 표기돼 있는 한글 안내판의 모습)
.
하지만 인공지능의 등장 이후, 구글 번역기나 네이버 파파고의 번역 기술은 상당히 향상되었습니다. ‘인공신경망’이라는 최첨단 기술 도입 후로 그 성능이 상당히 좋아졌다는 것인데요, 우선 인공신경망이라는 것이 대체 무엇인지, 그 정의부터 보겠습니다.
.
.
이때까지의 인터넷 번역 도구들의 번역 루트는 통계 기반 형식으로 이루어져 왔습니다. 예를 들어, ‘아침’이라는 단어를 번역할 때 ‘morning’ 혹은 ‘breakfast’로 할지 결정 여부는 해당 문장에 ‘일어났다/상쾌하다/맛있다/먹었다’ 등의 단어들이 등장하는 비율이었죠. 이른바 확률의 문제였습니다. 또한 인터넷 번역 도구들은 개발자가 입력해둔 일정 문법 구조를 따라 번역을 진행했는데 이와 다른 구조의 문장을 만날 시 우리가 흔히 보았던 ‘발번역’을 만들어내곤 했죠. 따라서 모든 문법구조를 일일이 입력해야만 하는 번거로움을 거쳐야 했습니다.
하지만 지금은 인공신경망을 활용하여 번역이 비교적 정확해졌습니다. 인공신경망, 즉 Neural Translate라고 하는 기술은 사람이 생각하는 방식처럼 인공신경망을 구축한 뒤 컴퓨터로 하여금 판단하게 합니다. 딥러닝을 이용해 스스로 학습하도록 하는 것이죠. 예를 들어, 100개의 잘 된 번역사례를 입력하고 이를 토대로 인공지능으로 하여금 나름의 규칙을 만들게 합니다. 인공지능은 이렇게 만들어진 규칙으로 다른 300개의 번역 결과를 내놓죠. 이 결과는 잘 번역된 300개의 문장들과 비교되어 인공지능이 스스로 만든 규칙을 점차 확대하고 수정해나가게끔 합니다.
.
| 출처 조선멤버스 |
.
어구 단위로 끊어 번역되었던 과거와는 달리 현재는 인공신경망의 활용으로 문장 단위로 끊어 번역되기에 문맥파악이 가능해졌다고 합니다. 구글에서는 GNMT(Google Neural Machine Translation)로, 네이버에서는 N2MT(Naver Neural Machine Translation)로 불리는 이 기술은 시간이 흐를수록 점차 정확한 번역을 내놓을 것으로 판단됩니다.
.
인공신경망 도입 이후 구글 번역기나 네이버의 파파고 등은 한결 다양해진 기능들과 한층 더 정교해진 번역 결과들을 내놓고 있습니다. 구글 번역기는 현재 다양한 언어 데이터베이스를 보유하고 있어 그 어떤 도구보다 번역의 폭이 넓습니다. 또한 발화된 음성을 번역하는 서비스, 증강현실(AR)을 활용한 사진 번역 그리고 음성 발음 확인 서비스 등의 기술은 원활한 번역 및 통역을 돕고 있죠. (사담이지만, 개인적으로 사진번역 기능을 해외에서 정말 유용하게 잘 사용했습니다. 촬영 후 사진에서 번역하고 싶은 부분을 문지르면 그 해당 부분만 번역되는 이 기능은 마트에서 장을 보거나 해당 나라 교통 앱을 사용할 때 많은 도움이 되었습니다. 덕분에 독일로 가는 기차도 안 놓치고 잘 탈 수 있었어요.)
.
| 출처 mashable |
.
네이버는 비교적 최근에 ‘파파고’라는 번역 도구를 내놓았는데요, 구글 번역기보다 ‘한국 친화적’이라는 면모를 내세워 국내 사용자들이 더 원활히 사용할 수 있는 도구임을 강조했습니다. 아무래도 국내에서 만들어진 솔루션이다보니 한국에서만 쓰이는 표현(ex.꿀잼)이나 방언 등은 구글보다 훨씬 더 잘 번역되고 있습니다. 또한 동음이의어의 경우 여러 가지 뜻을 함께 보여주어 오차를 줄이고 비용/금액에도 실시간 환율을 적용해 더 정확한 번역을 제시하고 있습니다. 이외에도 한컴의 지니톡은 파파고와 마찬가지로 텍스트, 음성, 이미지 내 문자 인식 및 번역이 가능하다고 합니다 한 가지 특이한 기능은 음성을 인식할 때 말하는 사람의 성별을 구분할 줄 알아 그에 맞는 맞춤형 결과를 들려준다는 것입니다. 또한 소음과 음성을 구별하는 기능이 있어 잡음이 많은 장소에서도 사용할 수 있다고 합니다.
.
.
과거와 비교했을 때 지금의 인터넷 번역 기술은 약 2배 가량 향상되었으며 오류 또한 55%~85% 정도 줄었다고 합니다. 스스로 학습하며 발전하는 인공지능의 특성상 앞으로 성능은 계속해서 향상될 것이며 이러한 발달은 첫 번째로 문학에 많은 영향을 끼칠 것으로 생각됩니다. 많은 국내 문학작품들이 해외에서 번역, 출판되어도 언어 장벽 때문에 한계가 있는 것이 현실입니다. 국내독자만큼이나 해외독자들에게도 작가의 의도, 가치관, 단어에서 주는 느낌 등이 전달되면 좋겠지만 말이 ‘아’ 다르고 ‘어’ 다르다고 현재까지는 아무리 뛰어난 번역가에게도 번역은 쉽지 않은 과제입니다. 해당 나라의 문화를 잘 이해하고 있어야 할뿐더러 사소한 단어 선택에서조차 독자에게 전달되는 느낌이 달라지기 때문이지요. 하지만 인공지능의 도움으로 이러한 차이들은 상당히 많이 개선될 여지가 있으며 훗날에는 한국 최초 문학노벨상을 기대해보아도 좋지 않을까 하는 생각을 조심스레 해봅니다.
.
| Tower of Babel, Pieter Brugel le Vieux |
.
인공지능 번역을 통해 또 한가지 기대할 수 있는 점은 바로 외국인들과의 원활한 의사소통입니다. 기술의 발전이 우리로 하여금 영어공부에서 벗어나게 할 수 있을지는 아직 모르겠지만 분명한 것은 통역가의 도움 없이 이루어지는 의사소통은 훨씬 편하고 빠르며 자연스러워질 것이라는 점입니다. 성경에 따르면 신은 하늘과 가까워지려고 한 인간들에게 분노하여 바벨탑을 무너뜨리고 하나였던 인간의 언어를 여러 종류로 나누었다고 합니다. 하지만 기술은 어느새 신의 형벌마저도 뛰어넘을 정도로 발달했고 우리는 이를 목격할 첫 번째 인류가 될지도 모르겠습니다.
.
.
.