금융IT

[2021 금융IT혁신] SAS, “AutoML전략으로 보다 강력한 금융 플랫폼 구현”

이상일

[디지털데일리 이상일기자] 금융업에서 마케팅이나 리스크 부문에서 일반적으로 사용하는 데이터 모델 전반에 ‘Auto ML(머신러닝)’을 이용하면 모델을 보다 손쉽게 만들고 유지 운영할 수 있을 것이라는 비전이 제시됐다.

8일부터 11일까지 4일간 <디지털데일리> 온라인 컨퍼런스 서비스 플랫폼인 DD튜브를 통해 진행되는 '2021 금융IT 혁신(Innovation)' 컨퍼런스에서 SAS코리아는 ‘AutoML을 활용한 금융플랫폼 혁신 전략’을 발표했다.

발표자로 나선 SAS코리아 최병정 상무는 “언택트 시대의 금융업무 효율성을 위해 AutoML이 필요하며, 이를 통해 분석과 운영의 가속화와 분석의 대중화가 가능해진다”고 강조했다.

현재 금융권에서 화두가 되고 있는 인공지능(AI)는 데이터로부터 배우는 ‘러닝(Learning)’과 새로운 데이터 입수를 통해 의사결정을 하기 위한 예측을 자동하는 ‘자동화(Automation)’를 축으로 움직인다. 하지만 SAS는 데이터로부터 배우고, 적용하고 운영을 자동화하는 전체 과정에 주목하고 있다.
최 상무는 “AI는 여러 영역에서 전 방위적으로 활용되고 있다. 금융권의 경우 사기방지, 신용평가, 금융 어드바이저, 챗봇으로도 확산되고 있다. 이처럼 AI활용이 증대되다 보니 전문 인력이 부족한 것도 사실이다. 때문에 AutoML이라는 기술이 발전하고 있다”고 진단했다.

SAS에 따르면, 그동안 AI와 머신러닝, 딥러닝 등 데이터 분석 기술은 데이터 과학자 등 일부만을 위한 기술이었다. 데이터 과학자들은 데이터 기술의 표준화, 프로세스 정립 전에 코딩에 의존해 규칙을 만들며 많은 공헌을 해왔다. 하지만 이러한 데이터 분석 기술이 표준궤도에 오르다보니 좀 더 손쉽게 쓸 수 있는 ‘AutoML’이 발전하고 있다는 설명이다.

그는 “AutoML는 AI를 만드는 AI다. 업무를 효율화하기 위해 머신러닝, 딥러닝 모델을 만들게 되는데 그 모형을 만들 때 AI의 도움을 받는 것을 의미한다. 모형을 만들 때 옵션으로 여러 가지 규칙을 만들어야 하는데 손쉽게 하나의 값으로 만 할 수는 없다. 정확도에 영향을 미치게 때문인데 이를 최소화하는데 필요한 하이퍼 파라미터를 찾는 과정을 SAS가 도와주고 있다”고 밝혔다.

한편 SAS는 데이터 준비, 시각화, 모델링, 결과해석, 운영시스템 적용, 관리, 모니터링 등 데이터 관련 모든 과정을 AutoML 프로세스로 보고 있다. AutoML을 통해 기업은 분석에 들이는 시간을 획기적으로 줄이고 비즈니스 가치 창출에 있어서도 전통적인 분석보다 선제적으로 대응 할 수 있다.

최병정 상무는 “모형을 만들고 유지 관리할 수 있는 플랫폼이 중요한데 SAS는 이러한 플랫폼을 제공한다. 데이터 분석 전 변수에 대한 이해가 선행돼야 한다. SAS는 ‘오토 프로파일링’을 통해 빠르고 명확한 속성 파악으로 데이터 이해도를 증대시킬 수 있으며 ‘오토 피처 엔지니어링’을 통해 데이터 품질을 개선하고 모델의 정확도를 향상할 수 있도록 정제 및 변환을 통해 짧은 시간에 좋은 모델을 만들 수 있도록 지원한다”고 설명했다.

이러한 과정을 통해 모델을 만들면 SAS는 모델이 만들어진 이유를 제시한다. 머신러닝과 AI기술이 발전하면서 복잡한 심층 신경망(DNN) 형태나 다양한 모델을 조합하는 등 모델이 매우 복잡해졌다. 이처럼 복잡한 머신러닝 모델을 블랙박스 모델이라고 부르는데 이러한 복잡한 머신러닝 모델을 쉽게 이해하고 해석하기 위해 모델 해석력 제고를 위한 기능도 제공한다.

배포단계와 관련, 최 상무는 “비즈니스 상황에 따라 배치에 따른 스코어링, 온라인, 실시간을 선택할 수 있다. 이를 SAS는 모두 지원하며 모델 개시 버튼만 누르면 모델이 바로 배포된다. 온라인이나 실시간의 경우 모형을 스코어링하는 속도가 중요한데 SAS는 ‘A스토어’라는 압축 바이너리로 제공한다”고 밝혔다.

배포를 끝으로 하나의 데이터 라이프 사이클이 끝난다. 하지만 시간이 지나면 모델의 성능이 떨어지고 결국 사장되는 경우를 반복하는 경우가 생긴다.

이를 극복하기 위해 모델을 한번 적용한 후 모니터링하는 단계가 추가됐다. 최 상무는 “모델이 잘 유지되는지 좋지 않은 변수영역이 무엇인지 판단해 그 부분을 수정하거나 셀프러닝 과정을 통해 모델의 정확도를 개선한다. AutoML의 마지막이자 화룡점정 단계가 바로 모니터링과 셀프러닝”이라고 강조했다. 그는 “모델을 모니터링하고 셀프 러닝하는 과정을 통해 분석 라이프사이클이 완성되고 비즈니스 가치 실현이 가능하다”고 덧붙였다.

SAS AutoML은 데이터 과학자뿐만 아니라 코드에 익숙하지 않은 분석가나 비즈니스 유저도 손쉽게 머신러닝을 사용할 수 있어 다양한 영역에 활용이 가능하다. AutoML을 통해 개발된 많은 머신러닝 모델을 손쉽게 운영환경에 적용할 수 있으므로 결과적으로는 비즈니스 가치를 극대화 할 수 있다.

또, SAS는 모델의 성능이나 시간은 데이터 및 주제에 따라 다르지만 SAS AutoML을 통해 모델링에 소요되는 시간을 수개월에서 수일로 단축할 수 있다고 설명한다. 실제 기존 오픈소스로 개발된 모델을 SAS AutoML을 적용해 모델링 한 결과 모델 성능이 30% 에서 크게는 2배 가까이 향상된 사례가 있다는 설명이다.

<이상일 기자>2401@ddaily.co.kr

이상일
2401@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널