e비즈*솔루션

서울시민 라이프스타일 알고 싶다면?…“LG CNS 합성데이터 활용해보세요”

권하영 기자

[Ⓒ LG CNS]

[디지털데일리 권하영기자] LG CNS가 서울시민의 생활 특성을 담은 가상의 ‘합성데이터(재현데이터)’를 생성해 본격 서비스 제공에 나섰다.

LG CNS는 ‘서울시민 라이프스타일 재현데이터’를 생성해 서울시 오픈 플랫폼인 빅데이터캠퍼스에 22일 공개했다.

합성데이터는 원본 데이터의 통계적 특성을 유지하면서, 개인식별 위험 없이 데이터 활용가치를 유지한다. LG CNS는 주민등록자료, 건축물대장, 민간3사(신용정보회사, 카드사, 통신사) 정보로 제작된 가명결합 데이터를 기반으로 합성데이터를 생성했다.

이번 서울시 합성데이터 생성 사업은 가명정보(공익 목적이거나 정보주체 동의가 없으면 특정 개인을 알아볼 수 없게 조치한 정보)와 합성데이터에 대한 높은 전문성을 필요로 했다.

이번에 LG CNS가 생성한 서울시 합성데이터는 충분한 안전성을 확보해 누구나 자유롭게 활용 가능하다는 설명이다. 서울시 합성데이터를 활용해 유관기관들은 정책연구 사전설계를, 시민들은 데이터 분석 실습 등을 더욱 활발하게 진행할 수 있다.

LG CNS는 활용사례(Use-Case) 설계부터 정교한 데이터 샘플링, 합성데이터 생성 모델 개발, 전·후처리 과정 등을 통해 대규모의 고품질 합성데이터를 생성했다.

‘서울시민 라이프스타일 재현데이터’는 범주형데이터(성별·색상 등 특정 범주로 구분되는 정성적인 데이터)와 수치형데이터(거리·무게 등 측정 가능한 양적 정보를 숫자를 통해 나타낸 데이터)가 공존하는 정형데이터다.

‘서울시민 금융현황’과 ‘서울시민 소비 및 이동 패턴’ 등 2가지 주제의 데이터세트로 제공돼 활용 가치가 높다. ‘서울시민 금융현황’ 데이터의 경우 약 65개의 변수, 약 740만건의 합성데이터로 이뤄져 있다.

이 합성데이터를 활용하고 싶은 기관 및 시민들은 빅데이터캠퍼스에서 ▲성별 ▲생년월일 ▲직업 ▲추정연소득 ▲자산금액 ▲대출잔액 등 약 65개의 변수를 조합해 서울시민의 금융 현황 데이터를 분석하고, 인사이트를 얻을 수 있다.

예를 들어, 서울시민 금융현황 합성 데이터를 통해 ▲1인 가구의 다인가구 대비 연체 및 대출 통계량 분석 ▲가구구성원 수 및 세대주 연령대에 따른 주택담보대출 상환비중 분석 ▲1인 가구 자영업자 경제적 부담 분석 등을 진행해 볼 수 있다.

LG CNS는 지난해 7월 금융위원회로부터 ‘데이터전문기관’으로 지정됐으며, 앞선 2022년 7월에는 개인정보보호위원회로부터 결합전문기관으로 지정됐다. 2021년 9월에는 금융위원회로부터 마이데이터 사업자 본허가를 획득하기도 했다.

LG CNS 데이터허브&플랫폼사업담당 황윤희 상무는 “고객들이 LG CNS의 가명정보 결합, 합성데이터 역량을 통해 새로운 비즈니스 인사이트와 기회를 얻을 수 있도록 서비스를 확대할 계획이며, 이를 통해 차별적 고객경험을 제공하겠다”고 강조했다.

권하영 기자
kwonhy@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널