[IT클로즈업] 음성대화 담은 '클로바X' 앱 출시?…네이버 "글쎄"
[디지털데일리 채성오기자] 네이버가 생성형 AI 모델 '하이퍼클로바X' 기반의 음성대화 서비스를 준비중인 가운데, 적용 방식을 두고 내부 논의중인 것으로 알려졌다. "대화형 AI 서비스 '클로바X'가 하이퍼클로바X 파운데이션 모델을 기반으로 하는 만큼, 음성 기능까지 추가될 것이"란 전망도 나왔지만 현재까진 방향성이 정해지지 않은 것으로 확인됐다.
1일 정보기술(IT)업계에 따르면, 네이버는 올 하반기 중 하이퍼클로바X 기반의 음성대화 서비스를 공개할 예정이다. 이를 통해 네이버는 하이퍼클로바X의 이용층을 확대한다는 계획이다.
이와 함께 네이버는 다음달 중 대화형 AI 서비스인 '클로바X'에 지난 20일 사내 공개된 새로운 하이퍼클로바X 파운데이션 모델을 탑재할 계획이다.
업데이트된 하이퍼클로바X 파운데이션 모델은 기존 대비 약 40% 수준의 파라미터 수로 구성돼 상대적으로 규모는 작지만 운영 비용이 기존 대비 50% 이상 개선된 반면, 성능은 이미지를 넘어 영상까지 이해할 수 있는 고도의 '멀티 모달리티' 능력을 갖춘 것으로 알려졌다.
관련 계획이 순차 발표되면서 하이퍼클로바X 기반의 음성대화 기능이 구현될 경우, 클로바X에 해당 기능이 추가될 가능성도 거론되고 있다. 실제로 지난 26일 한 매체는 "클로바X의 모바일 앱이 이르면 올 상반기 내 출시될 예정"이라고 보도하기도 했다.
그러나 <디지털데일리> 취재 결과, 현재 네이버가 준비 중인 음성대화 기능은 하이퍼클로바X 파운데이션 모델의 파생 격인 일종의 오디오 LLM(거대언어모델)을 적용하는 방식으로 확인됐다. 파운데이션 모델이 기본이 되는 '엔진'이라면 파생 AI모델은 이를 기반으로 파인튜닝(미세조정)을 거치거나 용도에 맞게 변형한 '액세서리'로 비유할 수 있다.
일례로 클로바X에서 지원하는 '이미지 이해' 기능은 파운데이션 모델의 파생 격인 '하이퍼클로바X 비전'을 통해 구현된다. 따라서 이미지와 텍스트 기반의 대화형 AI 서비스인 클로바X에서 음성대화를 구현하기 위해선 하이퍼클로바X 파운데이션 모델 뿐 아니라 오디오 LLM이 별도로 추가돼야 한다.
다시 말해 다음달 최신 버전의 하이퍼클로바X 파운데이션 모델이 클로바X에 적용되는 것은 음성대화 서비스와는 별개의 개념이다.
음성 대화 서비스를 위한 모바일 앱 출시 가능성도 의견이 분분한 상태다.
상대적으로 클로바X 혹은 별도 앱을 출시하는 것보다 클립, 치지직, 네이버TV 등 영상 기반 서비스에 오디오 LLM을 적용하고 이를 통해 음성대화 서비스를 구현하는 방안이 효과적일 것이란 목소리도 나온다. 음성대화 서비스를 위한 클로바X 모바일 앱이 출시되려면 관련 파생 AI모델(오디오 LLM) 적용이 선행돼야 하는 만큼, 오랜 시일이 걸린다는 이유에서다.
일각에선 하이퍼클로바X 기반 음성대화 서비스를 PC버전에 한정할 경우 접근성이 약화되는 만큼 모바일 앱 출시 가능성도 배제할 수 없을 것으로 보고 있다. 이미지 이해를 기반으로 한 대화형 AI 서비스인 클로바X에 음성 기능까지 추가하면 서비스 접근성이 분산될 우려가 낮아지기 때문이다.
이와 관련, 네이버 관계자는 <디지털데일리>에 "클로바X에 최신 하이퍼클로바X 파운데이션 모델이 적용되는데 이는 음성대화 서비스와는 다른 개념"이라며 "이용 과정에서 PC버전만으론 불편함이 발생할 수 있으니 모바일 앱도 고려해보는 정도일 뿐 음성대화 서비스를 구현할 파생 모델 적용 방안에 대해선 다양한 가능성을 열어 놓고 검토 중"이라고 말했다.
AI 쓰는 해커는 다르다? 올해 1월 '펑크섹' 피해 계속
2025-03-01 12:53:32[IT클로즈업] 음성대화 담은 '클로바X' 앱 출시?…네이버 "글쎄"
2025-03-01 12:52:07주파수 할당제도 ‘공급→수요’ 개선…방어적 방안은 아쉬움
2025-03-01 07:15:39법원, 영풍 '과징금 부과 취소 청구' 기각…석포제련소 카드뮴 포함된물 배출 혐의 인정되나
2025-02-28 18:25:41