[디지털데일리 이종현기자] 디지털 뉴딜 정책의 핵심 사업으로 꼽히던 ‘데이터댐’의 개방이 본격화된다. 정부가 1년 이상 공들여 데이터가 민간에 공유됨에 따라 인공지능(AI) 기술 및 산업 발전의 촉진제가 될 것이라는 기대가 모인다.
18일 과학기술정보통신부(이하 과기정통부)와 한국지능정보사회진흥원(NIA)은 인공지능(AI) 학습용 데이터 170종, 4억8000만건을 ‘AI 허브’를 통해 개방한다고 밝혔다.
이번에 공개하는 AI 학습용 데이터는 ▲음성·자연어(한국어 방언 등 39종) ▲헬스케어(암진단 영상 등 32종) ▲자율주행(도로주행영상 등 21종) ▲비전(스포츠 동작 영상 등 15종) ▲국토환경(산림수종 이미지 등 12종) ▲농축수산(가축행동 영상 등 14종) ▲안전(노후 시설물 이미지 등 19종) ▲기타(패션상품 이미지 등 18종) 등이다.
정부는 민간의 수요를 바탕으로 분야별 산·학·연 전문가, 주요 활용기업 등이 데이터 기획부터 구축까지 함께했다. 국내 주요 AI·데이터 기업은 물론 주요 대학, 병원 등 총 674개 기업·기관이 참여했다는 설명이다.
개방되는 데이터의 품질이나 활용성을 검증·관리하기 위한 ‘품질자문위’도 운영했다. 네이버, 삼성전자, LG, 현대차, KT 등 주요 대기업과 스타트업, 대학 및 연구기관 등이 데이터 개방 전 활용성 검토를 진행하는 등 민간의 요구를 반영하는 데 공을 들였다.
과기정통부는 “이번에 AI 허브에 개방되는 AI 학습용 데이터는 비용과 인력 확보 등의 문제로 데이터를 직접 구축하기 어려운 중소기업이나 스타트업의 ‘데이터 갈증’을 어느 정도 해소할 수 있을 것으로 전망된다”고 말했다.
일시에 모든 데이터가 개방되는 것은 아니다. 특히 헬스케어 데이터 등 개인정보 및 민감정보가 포함될 우려가 있는 59종의 데이터는 최종검증을 거쳐 30일에 개방한다.
또 자율주행 데이터는 국내 도로주행 영상부터 주차 장애물·이동체 인지 영상, 버스 노선 주행 영상 등 데이터를 오는 30일까지 순차적으로 공개한다. 한국어 방언(경상·전라·충청·강원·제주) 발화 데이터도 30일 공개한다.
한편 과기정통부와 NIA는 이날 데이터댐의 개방과 함께 데이터 활용 촉진과 성과 확산을 위한 ‘AI 데이터 활용협의회’를 출범해기도 했다. 데이터 품질관리 전문기관인 정보통신기술협회(TTA)와 170종의 데이터 활용성 검토에 참여한 기업·기관을 중심으로 구성됐다.
임혜숙 과기정통부 장관은 “댐의 물이 대지 곳곳에서 스며들어 꽃을 피우듯, 이번에 공개되는 데이터들이 산업 곳곳에서 널리 활용돼 혁신의 열매를 맺을 수 있기를 기대한다”며 “정부는 누구나 데이터를 쉽게 활용하고 성과를 공유할 수 있는 환경을 조성하는 데 지원을 아끼지 않을 것”이라고 전했다.