[인터뷰] AI로 번역하고 사람이 교정하고… 플리토 “언어 장벽 무너뜨리자”
[디지털데일리 이종현기자] 인공지능(AI)이 사회 전 분야에 녹아들면서 언어의 장벽이 점차 무너지는 추세다. 음성을 AI가 인식하고 이를 받아쓰거나 요약 또는 번역하는 것이 특별하지 않게 됐다. 농담처럼 여겨지던 ‘외국어를 공부하지 않아도 되는 세상’이 점점 다가오는 중이다.
사실 이와 같은 번역 기술은 최근에 등장한 기술이라고 보기 어렵다. AI를 이용한 자동 번역 서비스는 10년 전부터 꾸준히 선보여졌다. 다만 낮은 정확도에 이질적인 문장으로 실사용에는 제약이 많았다. 프렌치스코 교황의 “war never again! never again war!”라는 트위터 내용을 2014년 마이크로소프트(MS)의 빙(Bing) 번역기가 “결코 다시 전쟁! 결코 다시 전쟁!”으로 번역한 것은 지금까지도 회자되는 밈(Meme)이다.
최근에는 전문가들도 놀랄 정도로 AI의 번역 수준이 향상됐다. 외국어를 하나도 모르는 사람도 외국인과 대화할 수 있는 수준에 이르렀다. 하지만 AI가 아무리 발전하더라도 100%의 정확도를 보일 수는 없다는 목소리도 나온다. 전문 번역 서비스를 제공하는 플리토 이정수 대표의 주장이다.
이정수 대표는 “AI가 언젠가는 사람이 하는 많은 일을 대체하게 될 거다. 운전처럼 정해진 답이 있는 영역일수록 기계가 사람만큼, 혹은 그 이상으로 잘할 수 있다”면서도 “하지만 완벽하게 대체가 안 되는 부분도 있다. 정해진 답이 없는 영역, 언어가 대표적이다. 앞으로도 언어는 어떤 형태로든 사람이 참여할 수밖에 없다”고 말했다.
◆“퇴근하세요”를 “Please work”로 번역하더니… 번역기의 대약진
플리토는 2012년 설립된 기업이다. 어린 시절을 외국에서 지낸 이정수 대표의 경험이 창업으로 이어졌다. 초창기에는 언어 데이터를 모으는 것부터 시작했다. 이후 수집한 데이터를 가공해 판매하고, 축적된 데이터를 바탕으로 번역 서비스를 제공하는 방식으로 사업을 확장해왔다.
이정수 대표는 “창업을 했던 2012년만 해도 번역 서비스가 없었다. 언젠가는 AI가 번역을 해주는 세상이 올 텐데 그게 언제가 될지는 모르겠고, 그걸 만들 수 있는 기술이나 자금이 없었던 만큼 당장할 수 있었던 데이터 수집부터 시작했다”며 “2016년 구글 알파고가 이세돌 9단을 이기면서 딥러닝이 널리 알려졌고, 데이터에 대한 수요가 커지면서 데이터를 정제‧판매하면서 사업을 본격화했다”고 말했다.
플리토가 데이터를 모으던 초창기 번역기의 수준은 처참했다. 이 대표는 ‘퇴근하세요’라는 문장을 구글 번역기에 돌렸더니 ‘Please work’로 번역했던 사례를 언급했다. 통계 기반 기계번역(SMT)의 한계인데, 사전의 단어를 그대로 번역하는 것까지는 가능했으나 변화형은 일일이 룰(Rule)을 설정해줘야 했다는 설명이다.
그는 2016년과 2022년에 기술적으로 큰 변화가 생겨났다고 밝혔다. 2016년 딥러닝 기반의 신경망번역기술이 도입되면서 데이터를 많이 넣으면 기계가 스스로 답을 찾게 됐다. 인간이 간간히 질문과 정답지 세트를 입력하면 되는 AI 번역의 시작이다. 그리고 2022년에는 텍스트뿐만 아니라 이미지까지도 포함하는 멀티모달이 가능해지면서 번역 성능이 크게 상승했다.
이처럼 기술이 진보하는 중이지만 플리토는 여전히 ‘사람’의 역할이 중요하다고 강조한다. 변수가 많은 언어의 특성상 AI가 100% 완벽한 대답을 내놓을 수는 없으며, 높은 정확도를 위해서는 사람의 개입이 필요하다는 것이다.
이 대표는 “최근 생성형 AI의 번역 수준이 높아진 것처럼 보이는 이유는 패러프라이징(Paraphrasing) 기법을 적극적으로 쓰기 때문이다. 이를 이용하면 굉장히 자연스러운 번역 결과를 만들어낼 수 있다. 하지만 의역(醫譯)을 하면서 잘못된 대답, 환각(Hallucination) 현상이 두드러지게 나타날 수 있기 때문”이라고 전했다.
◆1차 번역은 AI가, 전문가가 후교정… 디지털‧아날로그 결합한 ‘플리토’
플리토 역시 여타 번역 서비스처럼 AI를 적극적으로 활용 중이다. 특이한 것은 단순 번역에 그치지 않고 불특정 다수나 전문 번역가에게 교정을 요청할 수 있다는 점이다.
이 대표는 “플리토가 제공하는 서비스는 번역을 필요로 하는 사람들에게 선택지를 준다는 개념이다. 전문적인 번역이 필요하지 않다면 무료로 AI를 통한 번역을 하면 된다. 대신 내 말을 보다 정확히 이해해야 한다면 추가 교정을 맡길 수 있도록 돕는다”고 말했다.
AI로 번역 후 전문가가 교정을 경우 나오는 결과값은 일반적인 AI 번역에 비해 우수할 수밖에 없다. 다만 플리토의 경우 집단지성을 통해 지속적으로 강화학습을 함으로써 번역 수준을 높이고 있다는 점이 특징이다. 가령 ‘누네띠네’라는 과자를 음성으로 입력할 경우 구글, 딥엘 등은 ‘눈에 띄네’로 인식하는 반면 플리토는 누네띠네로 인식한다.
이 대표는 “플리토의 AI 기술이 타사보다 압도적으로 뛰어나서 그런 게 아니다. 많은 한국 사람들이 누네띠네를 발화했고, 이게 수차례 교정이 되면서 AI가 누네띠네라는 고유명사를 인지하게 됐다”고 피력했다.
플리토의 기존 역할이 번역 플랫폼이었다면 최근에는 번역 전문 기술 기업으로서의 역할을 강화하는 추세다. 상시 번역이 필요한 기업‧기관에게 그 기업에 맞는 번역 시스템을 구축할 수 있도록 돕는 역할이다. 최근 각광받는 소형언어모델(sLLM)의 일환으로, 할루시네이션을 억제하고 전문 영역에 대한 번역 성능을 높이는 인간피드백형강화학습(RLHF)를 제공한다.
그는 “AI의 가장 큰 목표는 초개인화다. 내 목소리, 말하는 방식까지 번역하는 거다. 굉장히 품격 있는 단어를 사용하며 말했는데 이를 일반적인 단얼 번역하면 아쉽지 않나”라며 “이런 전문화던 번역 모델을 만들려면 특정 데이터를 학습시킨 강화모델이 필요하다. 그리고 플리토는 오답을 줄이고 전문성을 높이는 분야에서 그 누구보다 앞서 있다고 자평한다”고 밝혔다.
◆실시간 콘퍼런스 통번역 서비스 출시… “빅테크와의 경쟁, 두렵지 않다”
플리토가 지난 1월 출시한 다국어 콘퍼런스용 통번역 솔루션 ‘라이브 번역’은 플리토가 가진 특징을 잘 보여주는 사례다. 전문 번역가를 고용하기 어려운 기업‧기관에게 업종별로 특화된 데이터셋을 적용한 번역 서비스를 제공한다는 것이 골자다. 실시간 번역 중 잘못된 번역의 경우 실시간으로 교정할 수 있다.
이 대표는 “아직 고유명사는 AI가 인지하지 못한다. 어떤 회사 이름을 말했는데 그 스펠링을 틀릴 수도 있다. 가령 회사 이름이 우리(Woli)인데 이게 신생기업이라면 기계는 번역하지 못한다. 이걸 직원 등이 실시간으로 수정하면 번역을 받아보는 사람들에게도 실시간으로 수정된다. 그리고 한 번 교정된 데이터는 학습되는데, 이런 식으로 나만의 AI 번역 서비스로 만들어갈 수 있다”고 강조했다.
그는 “작년까지만 해도 다른 사람들에게 통번역이 뜰 거라고 말해도 약간 시큰둥했다. 그런데 올해 글로벌 기업을 중심으로 온디바이스 AI 시장이 형성되면서 번역 서비스에 대한 관심이 늘어났다”며 “많은 기업들이 언어의 장벽을 무너뜨리기 위한 시도하면서 데이터에 대한 니즈도 커지고 있다. 이런 기업들이 필요로 하는 데이터를 플리토가 가지고 있는 것”이라고 말했다.
언어 번역 시장이 급속도로 커지는 상황에서 플리토는 완성된 번역 기능을 필요로 하는 이들, 또 고품질의 번역을 제공하기 위해 데이터를 필요로 하는 이들 모두를 고객으로 두고 있다. 시장의 성장이 기회가 되는 셈이다.
독특한 기술과 방식을 바탕으로 플리토는 해외 시장 공략에 박차를 가하는 중이다. 작년부터 해외 매출의 비중이 급상승했다. 2022년 36%가량이었던 해외 매출 비중은 2023년 3분기 기준 48%로 늘었다. 미국과 일본 시장에서의 성과가 두드러지는 중이다.
이 대표는 “AI에 대해 얘기할 때 가장 많이 언급되는 것이 사람과 기계의 대결구도다. 하지만 정작 AI 시스템들을 가장 많이 활용하고 있는 것은 전문가들”이라며 “언어적인 부분은 기계가 완벽히 대체하기가 어렵다. 결국 기계가 사람을 돕고, 사람은 지속해서 데이터를 만들어 기계를 학습시키는 선순환 구조를 만들겠다. 이를 통해 언젠가 언어의 장벽을 무너뜨리는 것이 플리토의 지향점”이라고 강조했다.
한편 플리토는 음성합성 및 메타휴먼 등 기술까지 융합한 AI 서비스를 선보일 예정이다. 이미 서울시와 협력해 관광안내소에 번역 서비스를 제공하고 있다. 외국어로 기기에 질문하면 담당자에게 번역된 문장이 전달되고, 한국어로 답변하면 다시 외국어로 번역돼 전달되는 식이다.
이 대표는 “지브리 테마파크에 갔더니 토토로가 안내를 해주면 특별하지 않을까”라는 아이디어도 제시했다. 지역 캐릭터와의 콜라보레이션 등을 통한 브랜드 마케팅 등 응용 분야가 무궁무진하다.
[2024 IT혁신상품] AI 협업부터 비정형데이터 보호까지…지란지교그룹 '각개약진'
2024-12-19 18:33:01비트코인, 1억5000만원대 유지…RWA NOVA 코인, 비트마트에 신규 상장
2024-12-19 18:06:07'계엄군 점거' 서버 살펴본 선관위 보안자문위…"침입 흔적 없다"
2024-12-19 17:56:25[현장] 티빙·웨이브 합병 두고 CEO별 온도차…"주주 동의 필요 vs 無 관여"
2024-12-19 17:13:57[DD퇴근길] 갈길 먼 AI 기본법…바디프랜드, '가구' 선보인 이유는
2024-12-19 16:52:18