인터넷

[창간기획⑫] 구글도 한국어 지원하는데…韓 기업이 AI 전쟁서 취해야 할 태도는

이나연 기자
네이버와 카카오 사옥 전경 [사진=네이버, 카카오]
네이버와 카카오 사옥 전경 [사진=네이버, 카카오]

[창간18주년 대기획] ‘AI 트랜스포메이션을 준비하라(Beyond AI)’

[디지털데일리 이나연 기자] 지난해 말 오픈AI가 공개한 생성형 인공지능(AI) 챗봇 ‘챗GPT’가 정보기술(IT)업계에 지각변동을 일으키며, 글로벌 빅테크를 중심으로 생성형 AI 경쟁이 본격화됐다. 구글과 마이크로소프트 등이 앞다퉈 막대한 자금력과 그간 축적한 기술력으로 생성형 AI 서비스를 내놓는 가운데, 모든 학습 데이터 근간이 되는 영어에 이어 주목받는 차세대 언어는 다름 아닌 한국어다.

최근 해외에서 구글 등 한국어 서비스를 하는 생성형 AI가 많아지면서 초거대 AI 기술을 주도하는 네이버와 카카오가 또 다른 도전에 직면했다. AI 전쟁에 도전장을 내민 네이버와 카카오는 해외 기업들에 비해 기술력은 다소 뒤처지는 한계를 인정하면서도, 여전히 한국어에 강하다는 점을 차별화로 꼽는다.

◆빅테크가 한국어에 눈독 들이는 이유? “외국어 번역 시험대로 제격”=글로벌 빅테크가 한국어와 연계한 생성형 AI 서비스를 선보이는 이유는 무엇일까. 한국어 사용 인구는 약 8000만명으로 전 세계 언어 중 23위에 불과하다. 하지만 어순·문법이 영어와 완전히 다르고 표현에 미묘한 부분이 많아 번역이 어렵다는 특성상, 외국어 번역 기술 시험대로 활용하기 적합하다. 여기에 최근 K-콘텐츠가 세계적인 인기를 끌면서 한국어 수요도 증가하는 추세다.

실제로, 구글은 최신 대규모 언어모델 ‘팜(PaLM)2’를 바드에 탑재하고 제1외국어로 한국어와 일본어를 우선 지원하고 있다. 순다르 피차이 구글 최고경영자(CEO)는 지난 11일(현지시간) 기자간담회에서 “영어라는 관점에서 한국어와 일본어는 상당히 어렵다”면서 “한국어와 일본어 도입은 바드가 다른 새로운 언어를 바드에 도입하고 시도하는 데 큰 도움이 될 것”이라고 설명했다.

일각에서는 구글이 한국 시장을 고른 이유가 국내 검색엔진 검색 점유율 1위인 네이버를 의식한 행보라고 해석하기도 한다.

독일 AI 번역기 ‘딥엘’은 연내 한국어 번역 서비스를 추가하고 오는 8월 기업 고객을 대상으로 하는 유료 번역 서비스 ‘딥엘 프로’를 국내 시장에 출시할 예정이다. 관련해 야렉 쿠틸로브스키 딥엘 CEO도 “한국어만의 독특한 특징 때문에 한국어 번역 과정이 복잡하다”며 “그래서 번역 서비스 수요가 높다”고 말한 바 있다.

초거대 AI 모델인 네이버 ‘하이퍼클로바X’와 카카오 ‘코GPT’ [사진=네이버, 카카오브레인]
초거대 AI 모델인 네이버 ‘하이퍼클로바X’와 카카오 ‘코GPT’ [사진=네이버, 카카오브레인]

◆한국어 특화만으로는 부족…“결국 글로벌로 가야”=해외 주요 생성형 AI 서비스들이 한국어 지원을 통해 국내 시장 선점 준비에 돌입한 것과 달리 네이버와 카카오는 아직 이렇다 할 결과물을 내놓지 못한 후발 주자다. 이에 전문가들은 국내 기업들이 글로벌 기업들과 견줘 생성형 AI로 경쟁력을 얻기 위해서는 역설적으로 한국어 특화라는 기술 정체성에서 벗어나야 한다고 조언한다.

최경진 인공지능법학회장(전 개인정보보호법학회장·가천대 법학과 교수)은 “현재 챗GPT가 제너럴AI(범용 인공지능) 초기 버전으로 새로운 시장을 열었다고 평가받는 상황”이라며 “네이버와 카카오는 관련 AI를 만들 때 무조건 글로벌을 생각해야 한다”고 제언했다.

양사가 챗GPT에 대항할 국내 서비스 특성으로 한국어 특화를 언급한 것처럼 일단 그간 축적한 한국어 데이터 학습을 통해 AI 시장에 뛰어들되, 결국 겨냥해야 할 이용자는 국내와 해외 모두가 돼야 한다는 설명이다.

최경진 학회장은 “AI는 학습하는 데이터양과 질에 따라 성능이 달라진다”며 “네이버와 카카오는 당연히 출시를 앞둔 AI 서비스에 성공해야 하나, 이를 바탕으로 해외 시장에 진출하지 않으면 살아남을 수 없다”고 말했다.

챗GPT를 비롯한 생성형 AI는 영어가 아닌 다른 국가 언어에 대한 학습 속도가 빠르다. 챗GPT 고급 버전인 챗GPT-4 경우 이전 버전 대비 한국어 정확도를 77%까지 끌어올렸다. 영어 정확도는 약 86% 수준으로 알려져 있다. 구글을 비롯해 많은 글로벌 빅테크가 한국어 지원을 이미 도입했거나 고려 중인 만큼, 외국산 AI의 한국어 학습 수준은 갈수록 빠르게 발달할 것으로 보인다.

정보통신기술(ICT) 기술수준조사 및 기술경쟁력분석 보고서(IITP)에 따르면, 한국 AI 기술 발전 속도는 빠른 편이나, 전반적인 AI 분야 기술 수준은 미국을 100으로 놓았을 때 89.1 수준이다.

최 학회장은 “국내 IT기업 입장에서 AI 기술 개발은 선택이 아닌 필수다. 그렇지 않으면 해외 기업들에 금방 잠식당할 수밖에 없다”며 “우리도 한국어 데이터뿐만 아니라, 다양한 국가 데이터를 학습시켜 ‘제너럴’과 ‘글로벌’을 함께 지향해야 한다”고 강조했다.

◆“한국도 질 수 없다” 네이버 vs 카카오 불붙는 AI 경쟁=이와 관련 네이버와 카카오는 기술 연구개발 및 서비스 고도화에 한창이다. 다만, 이들 기업은 글로벌 빅테크에 비해 시작이 다소 느린 만큼, 국내 기업만의 차별화된 무언가가 필요하다는 과제를 해결해야 한다.

네이버와 카카오는 올해 하반기 초거대 AI 모델 ‘하이퍼클로바X’·차세대 AI 검색 기능 ‘서치GPT’(가칭)와 자체 AI 언어모델 ‘코GPT 2.0’(가칭)를 각각 공개할 계획이다.

네이버 하이퍼클로바X는 기존 초거대 AI 모델 하이퍼클로바 성능을 높인 서비스다. 네이버에 따르면 하이퍼클로바X는 챗GPT(GPT-3 적용 모델 기준) 대비 한국어 학습량이 6500배 많다. 향후 네이버는 검색뿐만 아니라, 쇼핑과 블로그 추천 등 모든 서비스에 초거대 AI 모델을 접목한다는 방침이다.

카카오 코GPT 2.0은 한국어 특화 초거대 AI 모델 코GPT 업그레이드 버전이다. 애초 이 서비스는 올 상반기 공개가 예정됐지만, 하반기로 일정이 미뤄졌다. 다만, 카카오는 한국어 특화 모델로는 부족함 없이 준비 중이며 글로벌 기업들과 사업적 협력도 모색하겠다는 전략이다.

이나연 기자
lny@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널