인터넷

서비스 장애 그 후, ‘카카오’ 완전히 바뀝니다

최민지

-연례 개발자 콘퍼런스서 장애 원인 분석과 재발방지대책 발표

[디지털데일리 최민지 기자] 지난 10월15일 SK C&C 판교데이터센터 화재로 발생한 서비스 장애를 계기로, 카카오가 조직구성부터 시스템 이중화·미래 투자에 이르기까지 완전히 새롭게 변화한다.

카카오는 서비스 장애에 대한 책임을 다하고 재발방지를 약속하기 위해 연례 개발자 콘퍼런스 ‘이프카카오데브2022(if kakao dev 2022, 이하 이프카카오)’에서 장애원인과 향후 개선방안을 모두 공개했다. 스스로 치부를 드러내는 전례 없는 사과 방식이다. 그만큼, 카카오가 이번 사태에 책임을 다하겠다는 뜻이다.

가장 큰 변화는 인프라 조직의 재구성이다. 현재 카카오 IT 엔지니어링 조직은 개발 조직산하에 있지만, 앞으로 카카오 최고경영자(CEO) 직할 부문 규모로 전담 조직을 확대 편성한다. 기존 개발조직에서 분리돼 별도 상위조직으로 올라간 것이다. 이를 위해 카카오엔터프라이즈 부사장 고우찬 카카오 재발방지공동소위원장을 영입했다.

카카오는 IT엔지니어링 전문가들로 전담조직을 만들어 안정적인 서비스 환경을 조성하고 투자하는데 집중한다. 서비스 안정성과 연속성 확보에 필수적인 항목을 도출하고, 실제적으로 지속 운영‧발전할 수 있도록 하는 전담조직이다. 서비스 장애 초기 컨트롤타워 부재 지적을 들었던 만큼, 대규모 장애에 즉각 대비할 수 있도록 재해복구위원회도 신설한다.

이와 관련 남궁훈 재발방지대책 공동소위원장은 카카오 ESG(환경, 사회, 지배구조) 최우선 과제를 ‘서비스를 안정적으로 제공하는 것’으로 설정하고 인프라 개선을 위해 과거 원인분석, 현재 재발방지책, 미래 투자 크게 3가지 관점에서 실천과제를 세우겠다고 밝혔다.

이날 그렙 공동대표인 이확영 원인조사소위원장은 카카오 서비스 주요 장애 원인으로 데이터센터와 운영 관리 도구들 이중화 미흡, 가용 자원 부족 등을 꼽았다.

이에 카카오는 지난 5년간 투자 금액 3배 이상 규모로 향후 5년간 투자를 확대한다. 서비스 주요 장애원인을 파악했으니, 이를 개선하는 데 쓰인다. 카카오는 전 시스템을 이중화할 방침이다.

카카오는 데이터센터 이중화, 데이터와 서비스 이중화, 플랫폼과 운영 도구 이중화 등 인프라 하드웨어 설비부터 서비스 애플리케이션에 이르기까지 시스템 전체의 철저한 이중화를 적용하기로 했다. 모니터링 시스템 다중화, 데이터 다중 복제 구조 구성, 운영관리도구 삼중화 등 구체적인 개선 사항들도 포함시켰다.

이뿐 아니라, 비상대응계획(BCP) 외부 자문을 구하는 한편 데이터센터 삼중화에 나선다. 3개 데이터센터 중 하나가 무력화될 경우를 대비하겠다는 것이다. 자체 아키텍처 확충 및 구조 개선과 더불어 외부 클라우드를 안전장치로 추가한다. 모두 무력화될 경우 꼭 단기간 내 살려야 할 서비스를 위해 원격지 재해복구(DR) 데이터센터를 별도로 구축한다.

한양대 에리카캠퍼스(안산)에 설립 중인 카카오 자체 데이터센터 경우, 이번 판교데이터센터 화재 사고를 교훈 삼아 무정전전원장치(UPS)실과 배터리실을 방화 격벽으로 각각 분리 시공해 배터리실에 화재가 발생하더라도 나머지 시설 작동에 영향을 주지 않도록 했다. 3중 진화방식을 단계적으로 자동 적용하고, 침수‧해일‧지진 등 극단적 재난재해 대비책도 완비했다. 안산데이터센터는 2024년을 목표로 안산데이터센터 설립에 4600억원 예산을 투입해 시공 중이다.

이 외에도 장애 대비 훈련 강화와 국내 최고 IT 엔지니어링 인재 채용‧육성에 나설 방침이다.

남궁훈 소위원장은 “재발방지대책을 세우면서 ‘이랬더라면 이런 불상사가 일어나지 않았을텐데’라는 생각을 여러 번 했다”며 “이미 사고는 발생했기에 조금은 늦었지만 지금이라도 반성하고 개선하려고 한다”고 말했다.

이어 “(서비스 장애 이후) 한 달 반 정도 고민한 부분에 대해서 말하는 자리로, 카카오는 여기서 멈추지 않고 계속해서 서비스 안정성에 대해서 고민하고 소통할 예정”이라며 “미래에는 이런 사고가 발생하지 않도록 최선을 다하겠다. 앞으로도 카카오 서비스 안정화가 최우선과제이며, 사회적 책임이라는 것을 항상 명심하겠다”고 덧붙였다.

한편, 카카오는 오는 8일 이프카카오 ‘1015 회고’ 특별 세션 5개를 별도로 열고 ▲데이터센터 ▲인프라 설비 ▲데이터 ▲서비스 플랫폼 ▲에플리케이션 다섯 개 영역에 적용하는 다중화 기술에 관해 개별적으로 설명하는 자리를 이어갈 예정이다.
최민지
cmj@ddaily.co.kr
기자의 전체기사 보기 기자의 전체기사 보기
디지털데일리가 직접 편집한 뉴스 채널