기업뉴스

와이즈넛, 텍스트 데이터 요약 위한 AI 학습데이터 구축 사업 선정

이종현
[디지털데일리 이종현기자] 인공지능(AI) 및 빅데이터 활용, 플랫폼 및 모바일 기술 확산 등으로 텍스트 데이터를 쉽게 이해할 수 있는 자동 요약 기술이 상용화되는 추세다. 관련 정부 사업이 진행되는 가운데 챗봇 서비스 기업 와이즈넛이 이에 참여했다.

9일 와이즈넛은 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 지원하는 2021년 AI 학습용 데이터 구축 사업에서 ‘요약 텍스트 데이터’ 과제의 주관기관으로 선정됐다고 밝혔다.

와이즈넛은 유클리드소프트, 딥네츄럴, 포티투마루와 함께 컨소시엄을 구축해 텍스트 요약을 위한 AI 학습데이터 구축 사업을 진행한다. 총 사업비는 42억5000만원 규모다.

올해 내 완료 예정인 해당 과제는 뉴스, 보도자료, 회의록과 방송 다큐멘터리, 드라마, 예능 방송 등 주요 내용을 정리·요약해, 양질의 학습데이터 확보 및 요약 모델 구축을 목표로 하고 있다.

와이즈넛에 따르면 현재 시장에서 서비스 중인 기술은 본문에서 중요한 내용을 그대로 가져오는 ‘추출요약’ 기술을 적용한 것이 대부분이다. 와이즈넛은 이번 과제를 통해 추출요약을 포함해 원문에서 중요한 문장을 하나의 새로운 요약문으로 만드는 ‘생성요약’을 위한 데이터셋을 구축하고 실제 모델을 구축한다는 방침이다.

요약 데이터의 다양성 확보를 위해 중앙일보의 뉴스데이터와 KBS의 드라마, 시사교양, 예능, 다큐멘터리 등 데이터를 활용할 예정이다.

최종적으로 구축된 학습데이터와 요약 모델은 모두 AI 허브를 통해 공개돼 누구나 활용 가능하다. 각 비즈니스 활용 목적에 맞는 양질의 요약 데이터를 누구나 쉽게 확보하고 활용할 수 있어 국내 중소·벤처기업의 시간 및 비용적 어려움을 최소화할 것으로 기대된다는 것이 와이즈넛의 설명이다.

강용성 와이즈넛 대표는 “이번 요약 텍스트 데이터 기술을 통해 양질의 학습데이터를 확보하고, 이를 공공 기술 및 데이터로 개방하는 과정에서 향후 AI 요약 기술 분야의 자생적 생태계를 조성하는 마중물이 될 것으로 기대한다”며 “와이즈넛은 AI 학습용 데이터 마련을 통해 빅데이터 산업 활성화에 기여할 수 있도록 지속 노력할 것”이라고 말했다.
이종현
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널