법제도/정책

개인정보위, AI 학습용 데이터 개인정보보호 강화 지원한다

이종현
[디지털데일리 이종현기자] 개인정보보호위원회(이하 개인정보위)가 지난 18일부터 개방을 시작한 ‘데이터댐’의 인공지능(AI) 학습용 데이터가 개인정보 관련 법규의 정합성을 준수할 수 있도록 지원한다.

23일 개인정보위는 한국인터넷진흥원(KISA)을 통해 과학기술정보통신부(이하 과기정통부)가 추진하는 AI 학습용 데이터 구축 사업의 개인정보보호 준수를 지원하는 중이라고 밝혔다.

개인정보위는 작년 11월 과기정통부와 디지털 뉴딜 사업을 추진하기 위한 업무협약을 체결했다. 이에 대한 후속조치의 일환으로 KISA를 통해 AI 학습용 데이터 중 일부 표본(샘플) 63종에 대해 개인정보 포함 여부 및 재식별 가능성 등을 검토했다.

이미지·영상 데이터의 경우 일부 인물 및 차량번호가 식별 가능하고, 비정형 문자 데이터의 경우 일부 개인정보의 가명처리가 미흡한 부분이 발견돼 지적했다.

이에 과기정통부와 한국지능정보사회진흥원(NIA)은 비식별 조치 전문기업과 함께 개인정보가 포함돼 있을 가능성이 있는 65종 1억8000여건의 AI 학습용 데이터를 점검, 가명처리를 추가 진행했다.

이미지·영상 데이터는 얼굴과 차량등록번호 등을 식별할 수 있는 경우 흐릿하게 편집처리했고, 비정형 문자 데이터는 이름·주소 등 개인정보가 확인되는 경우 해당 부분을 보통명사과 기호의 조합으로 가명처리하는 방식이다.

가명처리된 AI 학습용 데이터는 6월말까지 순차 개방되는 중이다. 개인정보위는 데이터가 개방되는 AI 허브에 3개월간 온라인 창구를 운영, 가명처리가 미흡한 데이터를 발견하고 의견을 제시할 경우 이를 신속하개 개선하겠다고 전했다.

개인정보위 관계자는 “앞으로도 AI 학습용 데이터가 체계적으로 보호 기반 위에 안전하게 활용될 수 있도록 적극 지원할 것”이라고 말했다.

<이종현 기자>bell@ddaily.co.kr
이종현
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널