클라우드 서비스 장애나면 보상은 어떻게 받을까
실제 장애는 약 오전 8시 15분경부터 발생해 배달의민족, 쿠팡, 야놀자, 여기어때, 마켓컬리와 같은 생활밀착형 애플리케이션과 업비트, 두나무 등 암호화폐거래소, KB금융지주(협업플랫폼), 신한은행(빅데이터 플랫폼) 등의 일부 서비스가 약 2시간 이상 정상적으로 이뤄지지 못했다.
이후 오후 3시9분경 AWS코리아 측은 “AWS 서울 리전에서 일부 DNS 서버 설정 오류로 인해 EC2 인스턴스가 84분 동안 DNS 기능을 할 수 없었다”며 “설정 오류는 해결됐으며 서버는 정상적으로 작동되고 있다”고 밝혔다. DNS는 인터넷 주소창에 문자로 구성된 도메인을 입력하면, 숫자로 된 실제 IP주소로 연결해주는 네트워크 서비스다.
AWS의 기본 서비스인 EC2에 문제가 생기자 아마존 API 게이트웨이, 아마존 키네시스 파이어호스, 아마존 MQ, 아마존 워크스페이스, AWS 엘라스틱빈스토크, AWS IoT, AWS 람다 등 다수의 서비스도 제대로 동작하지 않았다.
이 때문에 클라우드 서비스 장애시 업체의 대처 능력이나 피해 보상 범위 등은 앞으로 서비스를 선택하는데 중요한 요소가 될 것으로 보인다. 보통 클라우드 서비스 업체들은 SLA(Service Level Agreement)를 기반으로 장애에 대한 보상금액을 정한다. SLA는 일종의 서비스 수준 협약서로, 서비스 공급자와 사용자 간 공식적으로 합의되는 사항이다.
사전에 정의된 서비스 제공 수준이 미달되는 경우, 서비스 제공자는 고객에게 요금 중 일부를 배상하도록 돼 있다. 현재 주요 클라우드 서비스 제공 업체의 SLA는 일반적으로 99.50%~99.99% 수준이다.
월 가용성(%)은 100*[1-{서비스를 이용한 한달 동안 회사의 책임있는 사유로 인한 장애로 서비스를 이용하지 못하는 장애시간(분)의 합/서비스를 이용할 수 있는 기간 한달(분)}]으로 계산한다.
즉 월 가용성이 99.0%는 장애 허용시간이 한달에 432분(7.2시간), 99.50%는 216분(3.6시간), 99.95%의 경우 22분을 넘지 않아야 한다. 또 99.99%는 한달 기준 장애 시간이 4분 이상일 경우 보상을 받을 수 있었다.
현재 아마존의 EC2 서비스의 경우 최소 99.99%의 월간 가동률을 보장한다고 홈페이지에 명시돼 있다. 월별 가동시간이 99.0%~99.99% 미만일 경우 10%, 99.0% 미만일 경우 30%의 서비스 크레딧을 지급하는 구조다. 서비스 크레딧은 AWS 클라우드 서비스의 이용권을 뜻한다.
AWS코리아가 밝힌대로 EC2 인스턴스가 84분 동안 DNS 기능을 할 수 없었다고 치면, 99.0%~99.99%의 월 가동시간 범위에 들어가기 때문에 10%의 서비스 크레딧을 받을 수 있을 것으로 보인다. 기업마다 계약 조건에 따라 상이할 수는 있다.
물론 이러한 손해 배상은 천재지변이나 정기점검 등 불가피한 사유가 있는 경우는 제외된다. 또 손해배상은 고객이 직접 청구사유나 청구금액 및 산출근거를 기재해 제출해야 하는 수고가 필요하다. AWS의 경우 AWS 지원센터에서 사례를 등록하는 방식으로 청구하는 구조다. 크레딧 요청은 해당 사건(장애)이 발생한 이후 두 번째 대금청구주기의 종료일까지 AWS에게 접수해야 한다.
한편 AWS은 서비스 헬스(상태) 대시보드를 통해 각 지역별(리전) 서비스 운영 상태를 실시간으로 고지하고 있다. 서비스 장애 시에도 고객들에게 별도의 공지를 하지 않는 이유다. 서비스가 원활하게 운영되고 있을 경우 녹색, 문제가 있을 경우는 빨간색이나 파란색 등으로 경고하고 있다.
<백지영 기자>jyp@ddaily.co.kr
포시에스 박미경 대표, 하이서울기업협회 제7대 협회장 취임
2025-02-24 19:53:21AI 자산관리 플랫폼 에임 "이용자 자산 1천억원 대로 늘려"
2025-02-24 19:27:09[현장] "MZ세대가 위험하다"…웹툰·웹소설 불법유통, 도박 및 성매매로 확산
2025-02-24 17:59:29[DD퇴근길] 5G, 진짜 가입자는?…정부, 단말기준 집계 방식 바꿀까
2025-02-24 17:19:32