NIA, 한국어 음성·대화·복합영상 데이터 250만개 개방

정부공공IT

디지털데일리 발행일 2019-06-14 10:40:28

홍하나

[디지털데일리 홍하나기자] 한국 사람 감정에 대한 영상 정보, 한국어의 자연스러운 발성정보를 담은 인공지능(AI)용 데이터가 개방된다.

한국정보화진흥원(원장 문용식, NIA)은 250만개의 AI 학습용 데이터를 공개했다고 14일 밝혔다.

공개된 데이터는 ▲감정, 상황, 대화내용을 담고 있는 복합 영상 데이터 ▲자연스러운 한국어 대화 음성 데이터 ▲한국어 챗봇용 대화 및 시나리오 데이터 ▲한국어 기계독해 데이터 4종이다.

NIA에 따르면 데이터 확보가 AI 경쟁력이지만 대다수 중소, 벤처, 스타트업은 데이터 구축에 어려움을 겪고 있다. 따라서 ‘인공지능 데이터 구축‧공개 사업’은 AI 시장에 진입하고자 하는 신생기업들에게 도움이 될 것으로 보인다고 NIA 측은 기대감을 내비췄다.

그동안 NIA는 2017년부터 법률, 특허, 일반상식, 한국형 이미지 4종의 데이터셋 구축을 시작해 2019년 1월에는 관광, 농업, 헬스케어 등 7종을 개방했다. 6월에 한국어 음성 등 4종을 추가 개방했다.

올해 말에는 한-영 번역말뭉치, 한국형 사물이미지, 한글 글자체 이미지, 이상행동 영상 등 10종 2500여만건의 데이터셋을 대량 공개할 예정이다. 또 국가 연구개발(R&D) 과제인 지능정보 플래그십 사업 등을 통해 만들어진 AI 학습용 데이터 다수를 올 7월 AI허브에 공개할 예정이다.

데이터는 NIA가 운영하는 AI허브에서 회원가입을 통해 내려 받아 사용할 수 있다.

NIA 문용식 원장은 “AI 제품과 서비스가 활발하게 개발되고 출시될 수 있도록 수요에 꼭 맞는 데이터셋을 대량 구축‧공개해 국내 AI 산업과 시장의 경쟁력을 강화하는데 역량을 집중하겠다”고 밝혔다.

<홍하나 기자>hhn0626@ddaily.co.kr

홍하나

webmaster@ddaily.co.kr

기자의 전체기사 보기

이 기사와 관련된 기사

당신이 좋아할 만한 뉴스

연재기사

실시간 추천 뉴스

“예측 어려운 주파수 재할당대가, 사업자 투자에 영향 미칠수도”
2025-05-14 18:06:22
크래프톤, '어비스 오브 던전' 동남아·중남미에 6월 출시
2025-05-14 18:04:46
"사진 한 장이면 영상 뚝딱"…틱톡, AI 얼라이브 기능 출시
2025-05-14 17:59:42
'냉각' 경쟁 나란히 뛰어든 삼성·LG 다른 셈법…'빅딜 VS 협력'
2025-05-14 17:49:16
"침해 사고, SKT만의 문제 아니다…매일 바이러스 47만건 발견"
2025-05-14 17:49:06

회사명: ㈜디지털데일리｜제호: 디지털데일리｜등록번호 : 서울아00039｜등록발행연월일: 2005년 9월 6일｜사업자 등록번호: 101-86-13419
주소: (04057)서울특별시 마포구 신촌로14길 24(노고산동 54-46)｜대표전화: 02-334-7781｜Fax: 02-334-7782
대표자: 양경진｜편집국장: 채수웅｜개인정보·청소년보호책임자: 오주엽

뉴스

뉴스

기획/특집

부가서비스

이 기사와 관련된 기사

당신이 좋아할 만한 뉴스

많이 본 기사

연재기사

실시간 추천 뉴스