사이버보안, AI 데이터셋이 승패 가른다…온라인 개방 시작
[디지털데일리 김보민기자] 정부가 사이버보안에 특화된 인공지능(AI) 데이터셋을 온라인 개방한다. 8월까지 시범 운영을 거쳐, 수요 기업과 기관이 실제 데이터셋을 활용해볼 수 있도록 지원한다는다는 구상이다.
과학기술정보통신부(이하 과기정통부)와 한국인터넷진흥원(KISA)은 26일 용산 로얄파크컨벤션에서 '사이버보안 AI 데이터셋 구축 성과 공유회'를 개최했다. 현장에는 정창림 과기정통부 정보보호네트워크정책관, 이동근 KISA 디지털위협대응본부장을 비롯해 주요 관계자들이 참석했다.
이날 현장에서는 사이버보안 AI 데이터셋 사업에 대한 세부 계획이 소개됐다. 과기정통부와 KISA는 2021년부터 '국가 사이버 안전망 구축'의 일환으로 사이버보안 AI 데이터셋을 구축해 민간에 공유하고 있다. 관련 실증 사업도 지속 추진 중이다.
최보민 KISA 선임은 "이전에는 보안 기업들 사이에서 AI 데이터셋을 많이 요구했다면, 최근에는 보안 인프라가 잘 구축된 대기업과 공공기관에서도 요구가 늘고 있다"며 "보안 분석 방안과 위협 알림(alert)에 대한 피로도를 줄이자는 차원"이라고 설명했다.
사이버보안 AI 데이터셋은 이날부로 온라인에 시범 개방된다. 개방형 C-TAS 홈페이지 회원이고 활용 계획서 등이 확인된 사용자라면 누구나 활용이 가능하다. 사용자는 C-TAS 접속 후 '사이버보안 AI 데이터셋 제공' 페이지에 접속하면 된다. 최 선임은 "8월까지 시범 운영을 하면서 제안하고 있는 (데이터) 건수가 적정한지 등을 검토할 것"이라고 말했다. 현재 제공되는 데이터 규모는 약 2억건, 지원 건수는 3만건으로 제한된다.
최근 사이버보안 분야에서 AI 기술 활용에 대한 관심은 뜨거워지는 추세다. 사이버 공격자들이 AI 서비스를 활용해 위협을 가하고 있는 만큼 '이에는 이, 눈에는 눈' 전략을 꾀해야 한다는 취지다. AI 기술은 위협 탐지 및 분석, 맞춤형 보안모델 생성, 보안 담당자 부담 절감 등에 활용될 수 있다. 데이터셋은 이러한 AI 보안 모델을 생성하는 데 주 재료로 여겨진다.
과기정통부와 KISA는 AI 기술을 활용한 보안 제품과 서비스 개발에 필요한 데이터셋을 확장할 예정이다. 2021년에는 악성코드 및 침해사고 2개 분야에서 약 8억건을 구축한 바 있다. 2022년에는 애플리케이션 보안, 능동형 보안관제, 위협 프로파일링 3개 분야에서 6억건을 구축했다. 지난해에는 최신 침해사고, 위협 인텔리전스, 위협헌팅 3개 분야에서 6억건을 구축했다. 3년 만에 약 20억건의 기반을 마련한 셈이다.
지난해에는 민관 영역에서 주요 실증 성과가 나오기도 했다. 광주광역시청의 경우 랜섬웨어 감염 예방을 위해 직원 PC 보안 솔루션에 AI 데이터셋을 적용한 바 있다. 여기어때는 웹페이지 모니터링을 통해 수집되는 보안 이벤트를 탐지하고, 정오탐 분류를 자동화하기 위한 웹로그 분석 AI 모델에 집중했다. 한국전력공사는 공급망을 겨냥한 공격에 대응하기 위해 상시 위협 분석이 가능한 네트워크 기반 AI 모델을 마련했다.
최 선임은 "지난해에는 거대언어모델(LLM)을 어떻게 사이버보안 분야 데이터셋을 연계해 활용해볼 수 있을지 연구를 했다"며 "올해에도 검증(PoC) 모델을 개발해 AI 모델을 발굴하려는 노력을 지속할 예정"이라고 말했다. 끝으로 "사이버보안 분야에서 대한민국이 AI 주권을 확보할 수 있도록 학계 등과 협력을 추진할 것"이라고 강조했다.
[인터뷰] 돈 되는 렌탈 데이터?...신상용 프리핀스 대표 “렌탈 창업부터 금융 솔루션까지 함께할 플랫폼”
2024-11-23 12:05:50행안부, 클라우드 네이티브 제도개선 착수…“공공SW 전반 변화해야”
2024-11-23 09:39:29주파수 재할당대가, 정부가 부르는게 값? “산정방식 검토 필요”
2024-11-22 18:23:52