[디지털데일리 이종현기자] 과학기술정보통신부(이하 과기정통부)는 인공지능(AI) 개발에 필요한 학습용 데이터를 대규모로 구축·개방하는 ‘AI 학습용 데이터 사업’ 공모를 오는 12일부터 시작한다고 11일 밝혔다.
해당 사업은 기업, 연구자, 개인 등이 시간 및 비용 문제로 개별구축하기 어려운 AI 학습용 데이터를 대규모로 구축해 개방하는 사업이다. 2017년부터 지난해까지 한국어(음성·자연어), 헬스케어 등 분야서 191종의 데이터를 구축했다. 2021년 150종, 2025년까지 1300종을 구축·개방할 방침이다.
올해 구축되는 AI 학습용 데이터 150종은 ▲음성·자연어 ▲비전(영상·이미지) ▲헬스케어 ▲교통·물류 ▲농·축·수산 ▲재난·안전·환경 등 6대 핵심분야 지정 공모과제 130종과 자유 공모과제 20종으로 구성됐다.
과기정통부는 2925억원의 대규모 예산이 투입되는 해당 사업을 통해 AI 산업 발전의 기반을 구축하고 코로나발 일자리 위기의 충격을 완화하겠다는 목표다. 사업에 참여하는 수행기관은 1억원당 2.4명 이상의 직접고용을 의무화한다. 데이터 구축 과정에 국민 누구나 참여할 수 있는 크라우드소싱 방식을 적극 도입하도록 관련 예산 비중을 선정평가에 반영할 예정이다.
참여를 원하는 기업·기관은 과제별로 컨소시엄을 구성해 지원하면 된다. 과제별 크라우드소싱 플랫폼의 이 자리 정보는 AI허브 홈페이지를 통해 확인할 수 있다.