클라우드

카카오 대란, 재해복구시스템 정상작동 했나

이종현
15일 화재가 발생한 경기도 성남시 소재 SK C&C 판교 데이터센터
15일 화재가 발생한 경기도 성남시 소재 SK C&C 판교 데이터센터
[디지털데일리 이종현기자] 카카오가 15일 전체 서비스의 장애를 겪었다. 국민 소통 애플리케이션(앱)으로 쓰이는 카카오톡이 마비됐다. 카카오톡뿐만 아니라 카카오 계열사의 시스템 전반에서 장애가 발생했다. 여기에는 클라우드 사업을 펼치고 있는 카카오엔터프라이즈도 포함됐다. 기본 중의 기본인 재해복구(DR) 시스템에 대한 미비가 지적되는 상황이다.

15일 카카오는 경기도 성남시 소재 SK C&C 판교 데이터센터에서 발생한 화재 탓에 시스템 전반에서 장애가 발생했다. 오후 3시19분경 전기실에서 화재가 발생했고 3시22분경 전원을 차단했는데, 카카오의 서비스는 3시30분부터 마비되기 시작했다.

피해가 확산되자 정부도 나섰다. 과학기술정보통신부(이하 과기정통부)는 장애 복구를 위한 방송통신재난상황대응실을 구성해 밤샘 작업을 지원했다.

카카오는 16일 오전 1시31분경 카카오톡 메시지 수·발신 기능 일부를 복구했다고 발표했다. 다만 100% 복구는 아니다. 카카오톡 로그인 등 여러 오류들은 오전 9시20분까지도 이어지는 중이다.

무료로 서비스를 이용하는 일반인뿐만 아니라 돈을 내고 서비스를 이용하는 기업 고객들에게도 피해를 입었다. 카카오엔터프라이즈는 ▲카카오 i 커넥트 ▲아지트 ▲현대자동차 내 카카오 i 음성인식 ▲카카오워크 일부 기능 ▲카카오미니 ▲헤이카카오 ▲카카오홈 등 서비스에서 장애가 발생했다고 공지했다. 조치가 완료되면 추후 공지한다고 했지만 아직 추가 공지는 없는 상태다.

서비스 장애로 인한 책임공방은 불가피할 것으로 예상된다. 일차적으로 데이터센터 가동 중단은 서비스 레벨 어그리먼트(Service level agreement, SLA) 계약에 따라 이뤄질 예정이다. 데이터센터는 통상 99.xxxx% 가동을 전제로 계약이 이뤄진다. 만약 SLA 99.9%로 계약했다면 1년 내 8시간가량의 서비스 중단에 대해서는 보상이 이뤄지지 않는 구조다.

정보기술(IT) 업계 관계자는 “SLA 계약에 따라 달라지겠지만, 설령 그 범위를 벗어났다고 하더라도 사용료에 대해서만 보상하는 것이 대부분이다. 서비스 장애로 인한 책임은 입주 기업들이 져야 할 것”이라고 말했다.

또 “서비스 기업이 장애로 피해보상을 하는 경우가 드물다. 일부 이용 요금을 면제해준다든지 하는 정도가 아닐까 싶다”며 향후 사태를 점쳤다.

SK C&C는 “최대한 빨리 화재를 진화하고 데이터센터 운영 정상화할 수 있도록 최선을 다하겠다. 화재 진화 및 복구 시점 파악되면 다시 안내 하겠다”면서도 “일부 서비스들이 백업 미비 등으로 장애가 지속되는 부분은 해당 서비스 제공사에서 설명할 부분”이라고 선을 그었다.

이번 카카오 사태로 확인된 것은 카카오가 재해복구 시스템을 제대로 갖추지 않았다는 점이다. 재해복구는 이번 화재와 같이 예기치 못한 사고나 천재지변 등에 대비해 2개 이상의 데이터센터를 둔다. A 데이터센터가 멈추더라도 B 데이터센터를 통해 정상 서비스가 작동되도록 하는 구조다.

실제 카카오와 함께 SK C&C에 입주한 네이버, SK텔레콤, SK브로드밴드 등은 일부 오류가 발생했으나 카카오와 같은 전체 시스템 장애를 장시간 겪지는 않았다. SK C&C 판교 데이터센터의 복구가 이뤄지지 않은 만큼, 이들 기업은 재해복구가 정상적으로 작동한 셈이다.

카카오는 남궁훈, 홍은택 대표의 명의로 올린 사과문에서 “카카오는 모든 데이터를 국내 여러 데이터센터에 분할 백업하고 있으며 외부 상황에 따른 장애 대응을 위한 이원화 시스템을 가지고 있다”며 “다만 이번과 같이 데이터센터 한 곳 전체가 영향을 받는 것은 이례적인 상황으로 해당 조치를 적용하는 데 예상보다 오랜 시간이 소요되고 있다”며 재해복구 시스템을 마련했음을 시사했다. 정상적으로 작동하지 않은 것뿐이라는 설명이다.

재해복구는 기본 중의 기본으로 여겨진다. 한 개발자는 “중소 서비스 기업의 입장에서야 높은 비용 탓에 재해복구 시스템을 안 갖춘다지만, 계열사를 통해 클라우드 사업까지 전개 중인 카카오가 이에 대한 대비를 철저히 하지 않았다는 것은 이해하기 힘든 일”이라며 “평소에 점검은 잘 했는지 등을 살펴보는 것이 주요 과제가 될 것”이라고 지적했다.

한편 카카오는 2020년부터 한양대학교 에리카 캠퍼스에 자체 데이터센터를 건립 중이다. 2023년 완공을 목표로 한다.
이종현
bell@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널