30대 직장인 A씨는 요즘 학습지로 일본어를 배운다. 모르는 게 많지만 굳이 사전 찾느라 시간을 보내는 일은 없다. ‘구글번역’ 서비스를 쓰면 공부하다 부딪히는 문제는 대부분 쉽게 해결한다. 간혹 발음만 알거나 쓸 줄만 아는 단어·문장이 있더라도 스마트폰의 음성인식 또는 광학문자인식(OCR) 기능을 활용하면 금방 뜻을 찾는다. 이 서비스는 인공지능(AI) 번역의 한 예다.

미국 현지 대학 재학생 B씨는 스마트폰 애플리케이션(앱)으로 집단지성 번역 서비스를 이용한다. 앱에서 번역을 의뢰하면 사람들이 번역본을 각자 올리고 의뢰인이 마음에 드는 걸 고르는 시스템이다. 번역본이 채택된 사람에게는 현금으로 바꿀 수 있는 포인트가 지급된다. B씨도 번역에 참여해 한 달간 2만 포인트를 모았다. 약 14달러(약 1만6000원) 정도다.

구약성서의 바벨탑 이야기가 말해주듯, 다른 집단의 언어를 이해하는 건 인류가 오랜 세월 고민해온 과제였다. 4차 산업혁명 시대는 이 고민을 해결할 새 실마리를 내놨다. 빅데이터로 언어 번역 패턴을 학습한 AI가 쓰이고 집단지성을 체계적으로 활용한 번역 시스템이 상용화되는 등 번역의 세계에서도 새 바람이 분 지 오래다.

4차 산업혁명 시대의 기계번역

국내 학계도 바람에 민감히 반응하고 있다. 올해 20주년을 맞는 한국번역학회는 오는 20일 고려대 서울캠퍼스 문과대에서 여는 봄 학술대회에서 학회 역사상 처음으로 언어서비스제공(LSP) 업체들을 참여시킬 계획이다. 최근 번역 방식의 변화가 빨라진 데 따른 위기감 때문이다.

학계는 4차 산업혁명 시대 번역의 변화를 크게 ‘기계번역’과 ‘집단지성 번역’으로 정의한다. 이 중 기계번역의 발전에는 2016년 무렵 AI가 도입된 게 획기적 전기였다. 주 대상은 스마트폰 등 전자제품이나 소프트웨어 사용설명서 등 패턴이 일정하고 참고할 데이터가 공개된 콘텐츠다. 주요 스마트폰 업체에 매뉴얼을 개발, 납품하는 한샘EUG 등은 학계와 함께 기계번역 관련 연구를 진행하고 있다. 일반에도 익숙한 구글번역이나 네이버 파파고 번역서비스는 빅데이터에 기반해 AI를 구축한 예다.

다만 기술이 발전해도 기계번역 도입의 가능성이 적은 분야도 있다. 의료와 법률 번역처럼 책임소재가 분명해야 하는 영역이다. 한국번역학회 회장인 김순영 동국대 영어통·번역학과 교수는 “의료 번역에서 일어난 0.001%의 오류로 환자가 생명을 잃는다면 누군가에게 책임을 물을 수밖에 없다”면서 “자율주행 자동차에 운전이 가능한 이를 태우는 것과 비슷한 예”라고 설명했다.

AI 구축 과정에서 빅데이터로 쓰이는 인간의 번역물이 헐값에 취급받거나 저작권을 인정받지 못한다는 비판도 있다. 4차 산업혁명이 일어나는 다른 분야와 마찬가지로 빅데이터를 어떻게 윤리적으로 얻을지가 이슈다. LSP 업체 플리토의 이정수 대표는 “AI 개발업체는 많은데 데이터 얻을 곳은 적다보니 번역 업체가 기존 데이터를 무분별하게 AI 업체에 팔아버리는 경우가 잦다”면서 “번역가의 역할을 재정의하고 보상을 어떻게 받을지 논의해야 한다”고 말했다.

‘집단지성’ 활용한 대중문화 번역

2017년 3월 세계적 영상 콘텐츠 업체 넷플릭스는 야심찬 프로젝트를 내놨다. 각 언어의 자막 번역을 위해 자체적으로 번역가를 온라인 모집했다. 참여하려면 90분의 간단한 테스트만 거치면 됐다. 전문 번역가나 업체를 활용한 기존 시스템에서 벗어나 불특정 다수의 집단지성 시스템을 만들고 그 안에서 번역의 질을 평가, 개선한다는 계획이었다. 프로젝트에는 그리스 신화의 전령 ‘헤르메스(HERMES)’의 이름이 붙었다.

그러나 1년 만인 지난해 3월 넷플릭스는 별안간 프로젝트를 중단했다. 현지화 담당 매니저인 앨리슨 스미스는 지난해 10월 독일 베를린 콘퍼런스에서 이에 관한 질문을 받고 “인력 수급과 훈련, 서비스 제공 체계를 갖춘 번역 업체가 현지화 작업에 적합하다고 결론내렸다”고 답했다. 헤르메스 프로젝트의 사실상 실패를 인정한 답변이었다.

넷플릭스가 시도한 집단지성 활용은 새로운 시대 번역의 또 다른 경향이다. 번역 콘텐츠는 예전보다 훨씬 다양·복잡해졌고 소비자 태도도 쌍방향으로 바뀌었다. 특히 팬덤이 이미 형성된 대중문화 콘텐츠에서 이 같은 변화가 심하다. 최근 ‘어벤저스’ 영화 시리즈의 우리말 번역을 둘러싼 논란이 대표적 사례다. 비판이 자유로운 온라인을 도구 삼아 소비자들은 번역을 적극 평가하기 시작했다.

이를 반영한 게 ‘팬 번역’ 시스템을 차용한 집단지성 번역 체계다. 2000년대 초 국내에서도 활성화됐던 인터넷 자막처럼 여러 사람이 번역 데이터를 제공하고 이 중 추천을 많이 받는 게 채택되는 시스템이다. 기계번역과 달리 원 문장의 맥락과 의미를 파악하고 이를 다른 언어에 구현해내는 번역창조성(trans-creation)이 요구되며 생긴 경향이다. 국내에서도 플리토 등 일부 LSP 업체가 이를 도입했다. 다만 넷플릭스의 사례처럼 양질의 데이터를 선별하고 가치를 부여하는 작업이 쉽지 않다. 이 분야에서 역시 번역 결과물이 지나치게 헐값에 팔려나가는 게 또 다른 해결과제다.

집단지성 번역과는 반대의 경향도 있다. 일부 대중문화 콘텐츠 업체는 많은 자본을 들여 자체 전문인력을 갖추기도 한다. 게임 업체 블리자드는 한국 지사에 번역 담당과 검수 담당팀을 따로 만들어 번역 작업을 진행한다. 블리자드 관계자는 “게임 번역은 문학 번역부터 실용 번역까지 다양한 장르를 포함한다”면서 “때문에 게임 번역 작업자는 번역 실력은 물론 도구 사용 능력, 프로젝트 관리 능력도 갖춰야 한다”고 설명했다.

조효석 기자 promene@kmib.co.kr

트위터페이스북구글플러스