침해사고/위협동향

이루다 사태에 IT업계 초긴장··· 데이터 활용 막힐라 전전긍긍

이종현
[디지털데일리 이종현기자] 인공지능(AI) 챗봇 서비스 이루다 사태가 걷잡을 수 없이 커지고 있다. 일부 이용자가 20대 여대생을 의인화한 이루다를 성희롱한다는 비판에서 시작한 사태가 정보기술(IT) 업계의 데이터 활용에 대한 비판의 시각으로 비화됐다.

14일 업계에 따르면 이루다의 개발사 스캐터랩이 오픈소스 플랫폼 ‘깃허브’에 개인정보가 포함된 카카오톡 대화내용을 공유했다. AI 한국어 자연어처리(NLP) 기술 개발을 위한 데이터를 공유하는 차원에서 비식별 처리가 이뤄지지 않은 개인정보가 노출됐다는 것.

스캐터랩이 깃허브에 공유한 데이터에는 카카오톡 대화 1700여건 중에는 실명이 포함된 대화 20여건이 포함됐다. 직장명, 지역명, 지하철역, 이름, 도로 및 근처 영화관 이름 등 특정 개인을 식별할 수 있는 정보들도 공유됐다.

스캐터랩 측은 “2019년 깃허브에 오픈소스로 공개한 AI 한국어 NLP 연구 모델에 100건의 데이터(개별 문장으로 환산시 1700여건)이 포함됐다”며 “기본적으로 대화 중 실명은 ‘NAME’, 숫자는 ‘NUM’으로 자동화 비식별 처리했으나 기계적인 필터링 과정에서도 미처 걸러지지 못한 부분이 일부 존재했음을 확인했다”고 말했다.

또 “문제가 된 깃허브 레파지토리는 발견 즉시 해당 비공개 처리했다”며 “데이터 관리에 더 신중하지 못했고 일부 민감할 수 있는 정보가 포함된 대화 패턴이 노출된 점에 대해서 진심으로 사과드린다”고 사과했다.

IT 업계에서는 이루다 사태 초기 “잘못은 했지만 스타트업이니 법률 자문을 받기 어려워 실수를 했을 수 있었을 것”이라며 정상참작을 해야 한다는 의견과 “법 위반 가능성을 몰랐다는 것은 말도 안 된다. 또 2011년 설립됐고 조직원도 50명인 기업을 신생기업이라고 봐줘야 하나”는 긍정과 부정 의견이 공존했다.

남궁 카카오게임즈 대표는 11일 “이제 시작일 뿐인 이 산업이 규제로 혁신이 가둬지지 않을까 걱정된다”며 “모처럼 일어난 AI에 대한 사회의 관심을 긍정적인 방향으로 이끌어내야 한다”고 말했다. 지나친 마녀사냥을 피하고 문제 해결과 산업계 육성을 위한 근본적인 고민을 하자는 주장을 펼쳤다.

그러나 잇단 논란에 이루다에 대한 긍정론이 줄어들고 있다. AI가 혐오 표현을 했다는 것뿐만 아니라 개인의 동의 없이 데이터를 수집·활용했다는 것, 또 수집한 데이터를 깃허브와 같은 공개된 플랫폼에 공유한 것은 이해하기 어렵다는 시각이 지배적이다.

한 개발자는 “이루다와 같은 서비스를 개발하는 기업이 개인정보 수집이나 활용을 위한 법 이해도가 낮아 실수했다는 것은 납득하기 어려운 변명”이라며 “깃허브에 공유한 데이터 1700여건 중 개인정보 비식별 처리가 되지 않은 것이 20여건이라고 하는데, 제대로 된 비식별 처리 절차를 거쳤다면 있을 수 없는 비율”이라고 꼬집었다.

불법 개인정보 수집·유출 논란에 이루다는 “연애의과학 앱 초기 화면에 이용자가 로그인하기 전 ‘로그인함으로써 이용약관 및 개인정보취급방침에 동의합니다’라고 기재돼 있다”며 개인정보 수집 동의를 받았다는 입장이다. 하지만 이는 ‘동의’, ‘비동의’ 절차가 있는 것이 아닌 일방적인 안내다. 법조계 관계자는 “기존 사례를 봤을 때 이는 정상적인 동의 절차라고 보기 어렵다”고 지적했다.

설령 이용자의 동의를 받았다고 하더라도 문제의 소지는 있다. 업계 관계자는 “혼자서 글을 쓰는 일기장이라면 개인의 개인정보다. 하지만 2명 이상이 참여한 데이터를 개인의 정보라고 할 수 있는가”라고 반문했다. 연인 간의 대화 내용을 수집·활용했다면 양쪽의 동의를 거쳐야 하는데, 오늘의연애는 그렇지 않았다는 것.

이루다를 보는 눈은 점점 싸늘해지고 있다. IT 업계에서는 이제야 막 시작한 데이터 활용이 좌초되진 않을지 전전긍긍하다.

사태의 조사에 들어간 개인정보보호위원회(이하 개인정보위)와 한국인터넷진흥원(KISA)도 고민이 깊어질 것으로 보인다. 산업계 육성을 막아서는 안 된다는 공통의 인식이 있지만 사태가 커짐에 따라 ‘엄격한 처벌’을 해야 한다는 목소리가 나오고 있기 때문이다.

IT 업계 관계자는 “최대한 좋게 이해하려고 했지만 연이어 문제가 발생하니 곱게 보기 어려운 것이 사실”이라며 “워낙 큰 사건이 된 만큼 사태를 주시하고 있다. 부디 법령에 따라 정상적인 데이터 수집·활용을 하는 기업에 불똥이 튀지 않았으면 하는 바람”이라고 피력했다.

<이종현 기자>bell@ddaily.co.kr
이종현
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널