근미래를 그린 영화 에서 기차의 보안설계자 남궁민수(송강호)는 영어를 하지 않는다. 한국어만 사용하는 그는 영어를 쓰는 꼬리칸의 혁명가 커티스(크리스 에번스)와 대화할 때 주머니에서 둥그런 물체를 꺼내 입에 댄다. 번역기다. 남궁민수가 번역기에 대고 한국말을 하면 영어가 나온다. 번역기는 영화 속 심각한 상황에서 웃음을 유발하는데, 어색한 발음 때문이다. 번역기가 나오는 장면에서는 꼭 관객석 여기저기서 웃음이 터진다. 헤아려보면 영화 속 배경이 되는 시절은 2031년, 그리고 사람들이 열차에 탑승한 때는 17년 전인 2014년, 그러니까 번역기는 적어도 2014년 혹은 그 이전에 만들어진 것일 테다. 2013년 언저리에 만들어졌을 영화 속 번역기와 비교해 현실에서의 번역 프로그램은 어느 정도까지 도달했을까. 최근 어느 휴대전화 광고에서처럼 번역기를 사용해 서로 다른 언어로 끝말잇기 놀이를 하는 것은 가능할까. 힘들여 외국어 공부를 하지 않아도 기계에 의지해 수십 가지 언어로 대화하는 것은 가능한 일일까.
무료로 배포되거나 판매되는 자동번역 애플 몇 가지를 다운받아 사용해보았다. 현재까지 가장 많은 언어(56개)를 제공하는 ‘구글 번역’, 한국전자통신연구원 자동통역지식처리연구센터에서 개발한 ‘지니톡’, 앱스토어에서 높은 평점을 받은 ‘보이스 투 보이스 트랜스레이션’ 등을 이용해봤다.
‘잔뜩’이라는 단어는 모른다고!
번역기 사용법은 대부분 비슷하다. 번역하고 싶은 언어를 선택해 문장으로 입력하거나 음성으로 말하면 다른 언어로 번역된다. 번역된 결과는 화면에 문장으로 나타나고, 선택에 따라 음성으로 발음돼 나오기도 한다. 음성번역기의 경우 크게 세 가지 기술이 접목된다. 말소리를 인식해 해당 언어의 문자로 변환하는 받아쓰기 기능인 음성인식 기술, 한 언어의 문자를 다른 언어의 문자로 변환하는 자동번역 기술, 해당 언어의 문자를 말소리로 변환하는 음성합성 기술단계를 거쳐 하나의 문장이 다른 언어로 번역돼 나온다.
번역기에 대고 일상적으로 사용하는 몇 가지 문장을 말해보았다. 결과부터 말하면 음성인식은 거의 완성에 가까운 듯했다. 하지만 번역의 경우, 반말보다는 ‘-습니다, -습니까’ 등으로 끝나는 완결된 문장, 의문형보다는 평서형 문장을 더 잘 알아듣는 듯했다. 그리고 영화 속 남궁민수처럼 한숨을 쉰다거나 ‘아’ ‘에’와 같은 의미 없는 감탄사를 넣으면 번역기는 혼란스러워했다. 발음을 하기 전 기자가 무심코 콧소리를 내니 한 번역기는 ‘쌀’이라고 알아들었다. 여러 가지 상황의 변주가 가능한 일상적인 대화보다는 여행책자에 공식처럼 나와 있는 문장들의 번역이 정확한 편이었다. 이를테면 ‘이것은 얼마입니까’ ‘거기까지 거리가 먼가요’와 같은. 가장 중요한 것은 평소 말하듯 빨리 혹은 흘려 말해서는 소통이 불가능한 경우가 많다는 점이다. 또박또박, 공들여 발음하며 번역기에 말을 걸어보았다.
구글 번역은 웹상에서 외국 홈페이지를 번역해 보여주는 등 문어체 번역에 꽤 높은 정확성을 보이는 것으로 알려져 있다. 한국전자통신연구원 2월호에 따르면 최근 들어 빅데이터 말뭉치를 거대한 리소스로 활용해 자동번역 시스템이 구축되는 사례가 많은데, 구글의 경우 현재까지 세계 최대인 약 200억 단어급 규모로 병렬 말뭉치를 보유하고 있다고 한다. 앱을 사용해보니, 음성인식 뒤 번역된 결과를 화면 가로 사이즈로 크게 확대할 수 있어 대화하는 상대방에게 보여주기 유용하겠다는 생각이 들었다.
외국인을 만날 가능성이 가장 농후한 여행을 가정해보았다. “환전소가 어디인가요?”라고 말했다. 번역기는 “Where is currency exchange?”라고 번역했다. 반대의 경우도 해봤다. 번역기는 에서처럼 “환.전.소.가.어디.인가요”라고 약간은 어색하게 분절된 발음과 억양으로 말했다. 발음이야 어쨌든 뜻은 통한다. “맥주 마시러 가자”라고 말해보았다. 번역기는 “Let’s go for a beer”라고 정확한 번역을 내놓았다. 단어를 덧붙여보기로 했다. “맥주 잔뜩 마시러 가자.” 번역기는 ‘잔뜩’이라는 단어를 인식하지 못하는지 혼란을 보이기 시작했다. 받아쓰기부터 제대로 되지 않았다. 두 번, 세 번 말해봐도 “맥주잔 땡 마시러 가자”(Ding Let’s get a beer mug), “맥주 3병 마시러 가자”(Let’s get three bottles of beer) 등의 결과를 내놓았다.
“여름은 언제 끝나나”라고 말하니 발음한 그대로 음성인식을 하고 번역 결과는 “When summer kkeuntnana”라는 문장을 보여줬다. 어미 하나를 떼고 “여름은 언제 끝나”라고 하니 “When summer ends”라고 수정된 번역을 내놓았다. 일상적이지 않은 과학책의 한 구절도 읽어보았다. “집적회로의 성능과 정체성이 한꺼번에 향상되는 혁명적 변화가 지속되었다”라고 말하니 번역기는 정확하게 음성을 인식했다. 하지만 번역 결과는 단어의 나열에 따른 직역에 가까웠다. 100자가 넘어가자 텍스트 음성 변환도 되지 않았다. 단순하게, 전하고자 하는 말의 핵심만 담는다, 정도가 번역기 사용 팁인 걸까.
같은 문장을 다른 번역 앱에도 적용해보았다. 지니톡은 현재 영한·한영 번역만 지원한다. 여행 상황에 특화해 개발됐다. 대부분의 번역기가 주로 여성 음성으로 번역된 문장을 읽어주는 데 반해 지니톡은 남성의 목소리도 고를 수 있었다. 다른 번역기와 마찬가지로 음성인식이 완료되면 자동으로 번역된 문장이 나오고 발음을 들려주는데, 특징적인 점은 번역하기 애매하거나 알아듣기 힘든 문장의 경우 알려준 번역 외에 유사한 문장 예를 몇 가지 더 보여준다는 것이다.
예컨대 “어디에서 만날까?”라고 했을 때, 지니톡은 “Where do you want to meet?”와, 틀리긴 했지만 “When do you want to meet?” 등 또다른 선택지를 제시한다. 구글 번역기에 대고 말한 “환전소가 어디인가요?”라고 물었다. 지니톡은 “Where is the currency exchange office?” “Where is the foreign exchange?”라고 물음표까지 단 두 개의 문장 결과를 내놓는다. 발음도 비교적 자연스럽다. 반대의 경우인 영한 번역과 발음도 마찬가지로 자연스러운 편이었다. “맥주 마시러 가자”라는 문장은 “Let’s go have a beer”라는 번역을 보여줬다. 그럼 오늘처럼 더운 날 외국인 친구와 맥주를 많이 마시고 싶다면? “맥주 잔뜩 마시러 가자”는 문장에 지니톡도 헤매기 시작했다. 앱은 “맥주잔에 맥주 마시러 가자”(Let’s go to drink the beer with the beer glass)라는 결과를 보여줬다. “집적회로의 성능과 정체성이 한꺼번에 향상되는 혁명적 변화가 지속되었다”의 경우 “집적회로의 성능과 경제성이 한꺼번에 형성되는 용암의 온도 변화가 취소되었다”라며 받아쓰기가 제대로 되지 않는 모습을 보였다.
지니톡을 개발한 자동통역지식처리연구센터 자동통역연구팀 김상훈 팀장은 “제주 등 관광객이 많이 모이는 지역에서 상인들, 한국에 단체관광 온 외국인들이 아주 유용하게 사용한다고 한다. 일정 수준의 영어를 하지만 문장을 구현하는 데 어려움을 느끼는 사람 혹은 영어를 한마디도 못하는 사람도 대화가 가능해지니 여행에서 스트레스가 현격하게 줄어든다”고 한다. 지니톡은 한국어 27만 단어, 영어 6만5천 단어를 보유해 실제 여행 상황에서 자동통역률이 80%라고 한다.
과학책 단어만 옮기는 번역기들보이스 투 보이스 트렌스레이터(이하 보이스)는 21개 언어를 인식하고 번역한다. “환전소가 어디 있나요?”의 경우 “Where is currency exchane?”의 결과를 보여준다. “맥주 마시러 가자”는 “Let’s go for a beer”라고 번역하고, “맥주 잔뜩 마시러 가자”에서는 다른 번역기와 마찬가지로 헤매는 모습을 보였다. “맥주잔 때 마시러 가자”로 음성인식을 하고 “When you go to drink a glass of beer”라는 이상한 문장을 내놓았다. 과학책의 한 구절인 “집적회로의 성능과 경제성이 한꺼번에 향상되는 혁명적 변화가 지속되었다”의 경우 음성을 정확하게 인식했지만 구글 번역과 마찬가지로 단어 나열 수준의 문장을 제시했다. 대신에 보이스의 경우 긴 문장도 발음을 지원한다. 하지만 번역기의 대부분이 잘못 음성인식한 결과를 먼저 보여주기 때문에 외국인과 소통시 때때로 말이 통하지 않아 답답함은 있을지언정 실수할 가능성은 적어 보였다.
이외에도 삼성전자가 제공하는 소셜 네트워킹 앱인 ‘챗온’은 텍스트로 입력하는 대화를 9개 국어로 번역하고, 국내 포털 사이트 네이버에서 제공하는 ‘글로벌회화’는 영어·일본어·중국어를 포함해 13개 언어를 지원한다. 챗온은 삼성 계정을 따로 만들어야 하는 불편함이 있어 대중화되지 않았고, 네이버 글로벌회화는 음성인식은 뛰어나지만 문장 번역 기능이 다른 앱에 비해 좋지 못한 편이다. 대신에 여행영어 책자처럼 숙박·식당·교통 등 상황에 따른 문장이 카테고리별로 분류돼 있다. 한 단어를 입력하면 그 단어에 걸맞은 상황의 문장 예를 여러 가지 보여주는 기능도 갖췄다.
마지막으로, 이제까지 시험해본 애플들에 광고에서 그러듯 “머라카노”와 같은 지역어를 말해보았다. 구글 번역과 보이스는 음성 인식은 정확히 했으나 “kano isomerase”라는 거리가 먼 단어를 내놓았고 지니톡은 “Can it be said to be far?”라는 엉뚱한 문장을 제시했다. “머라꼬”라고 해보니 지니톡만 “what’s wrong with you?”라는, 어떤 상황에서는 뜻이 통할 만한 의역을 내놓았다. 김상훈 팀장은 이에 대해 “지역어 인식이 기술적으로는 가능하지만, 대부분 번역기가 표준어 발음과 단어에 맞춰져 있어 지역어의 경우 통역이 되지 않는다. 사람이 하는 통역도 대체로 표준어를 사용하는 상황이라 거기에 맞춰 개발했다”고 말했다.
“가능하다, 시간이 아주 오래 걸릴 뿐”김 팀장은 “번역기를 이용해 각자의 언어로 이야기하면서 대화가 끊기지 않고 자연스럽게 연결되도록 하는 것”이 개발자로서 목표라고 말했다. 외국어를 몰라도 그런 상황이 가능해질 것이냐는 물음에 “가능하다. 다만 시간이 아주 오래 걸릴 뿐”이라고 답변했다. 현재의 번역기는 상황에 적확한 완벽한 문장을 제시한다기보다는, 사전을 일일이 찾아가며 문장을 만들고 해석하는 수고를 덜어주는 도우미 역할이 큰 듯하다. 도서관에서 영어책을 붙들고 씨름하고, 일본어며 스페인어를 배우러 퇴근 뒤 학원에 다니는 직장인들의 일상이 앞으로도 한동안은 계속될지도.
신소윤 기자 yoon@hani.co.kr한겨레21 인기기사
한겨레 인기기사
[현장] “변명도 않는 뻔뻔함에 분노”…‘김건희 특검’ 시민들 나섰다
윤 ‘공천 개입’ 육성에 ‘문재인 시절’ 꺼낸 정진석…야 “하야 건의하라”
구급대원, 주검 옮기다 오열…“맙소사, 내 어머니가 분명해요”
교수 사회, ‘윤 대통령, 공천개입 의혹’으로 시국선언 잇따라
나는 ‘치매’다…그래도 “동창회 가야죠, 여행도 가고 싶고”
“보이저, 일어나!”…동면하던 ‘보이저 1호’ 43년 만에 깨웠다
윤석열판 ‘태블릿PC’ 나왔다, 검찰로 틀어막을 수 있겠나 [논썰]
‘봉지 커피’라서 만만한가…동서식품, 커피 제품 가격 8.9% 인상
대구시국회의 “윤석열은 대통령직에서 손 떼고 퇴진하라”
노화 척도 ‘한 발 버티기’…60대, 30초는 버텨야