[디지털데일리 이종현기자] 사이버보안 기업 파수는 인공지능(AI) 기술을 기반으로 비정형 데이터 내 개인정보를 검출·마스킹할 수 있는 신규 솔루션 ‘파수 AI 레이더(이하 파수 AIR)’를 공개했다고 21일 밝혔다.
파수 AIR는 기존 솔루션으로는 자동화된 탐지가 어려운 일반 문서, 이미지, 영상, 오디오 등 비정형 데이터에 포함된 개인정보를 탐지하는 것이 특징이다. 자연어처리(NLP) 및 광학문자인식(OCR) 기술이 활용됐다.
신규 솔루션에는 파수의 개인정보 비식별화 솔루션 ‘애널리틱DID’와 데이터 식별·분류 솔루션 ‘파수 데이터 레이더’ 등을 기반으로 개발됐다. 개인정보에 특화된 트레이닝 방법과 데이터셋을 파수 AIR에 적용, 개인정보 벤치마크 데이터셋에서 자연어처리 기준 93% 이상의 검출 정확성을 기록했다고 강조했다.
파수 AIR는 비정형 데이터 내 이름, 주민등록번호, 키, 몸무게, 상호, 계좌 및 카드번호, 주소 등 15개 개인정보 유형을 검출해 마스킹할 수 있다. 주소가 포함된 데이터의 경우 행정구역 체계를 광역시도, 시군구, 동읍면리, 상세주소 등으로 단계를 구분해 탐지한다. 키나 몸무게를 기타 길이와 무게와 구분하는 등 까다로운 문장 속에서도 높은 인지 정확도를 지녔다는 설명이다.
이에 더해 파수 AIR는 다양한 형태의 애플리케이션프로그래밍인터페이스(API)를 제공한다. 또 마스킹 결과에 대한 사용자의 피드백도 반영할 수 있다. 데이터 특성에 따라 AI 및 패턴 매칭 기법의 적용도 간으하다.
조규곤 파수 대표는 “개인정보보호는 선택이 아닌 필수 사항이 됐지만 비정형 텍스트나 이미지, 영상 등에 포함된 민감정보의 검출은 매우 까다로워 기업 및 기관이 큰 어려움을 겪고 있다”며 “파수 AIR는 개인정보에 최적화된 AI를 탑재한 가장 진보한 개인정보탐지 솔루션으로, 향후 기존 솔루션과의 연동 확대 및 고도화 등을 통해 고객의 개인정보보호 고민을 적극적으로 해결해 나갈 것”이라고 말했다.