[디지털데일리 이안나 기자] “정보기술(IT)를 운영하는 환경에선 언제든 IT인프라는 장애가 날 수 있다. 물리적 장애뿐 아니라 화재나 전력 같은 전체 센터 단위 장애도 발생할 수 있다. 하지만 실제 문제가 발생했을 때 안정적으로 대응한다면 이는 성공적인 실패(Successful Failure)라고 볼 수 있다.”
22일 서울 서초구 양재동 엘타워에서 개최된 <디지털데일리> 주최 ‘클라우드 임팩트 2023 콘퍼런스’에서 베리타스코리아 SE팀 신창희 상무<사진>는 ‘클라우드 환경에서 비즈니스 연속성을 위한 고가용성(HA)·재해복구(DR) 방안’을 주제로 발표에 나섰다.
주요 업무를 클라우드 환경에서 처리하는 기업들이 늘어나게 되면서 클라우드 환경에서 비즈니스 연속성을 구현하는 건 매우 중요한 과제가 됐다. 한 번 장애가 나면 업무가 중단될 뿐 아니라 기업 이미지까지 손상될 수 있기 때문이다.
IT기업을 대상으로 조사한 사례에선 비즈니스 연속성을 갖추지 못한 상태에선 기업 중 91%가 갑작스러운 장애에 대응하기까지 어느 정도 시간이 소요됐고, 약 80%는 고장 시간(다운타임) 때문에 발생되는 손실은 시간당 5000만원 이상이라고 답했다. 이중 약 25%는 시간당 5억원 이상 손실이 야기됐다. 산업 특성마다 다르지만 장애 발생에 따른 비용손실이 크다는 의미다.
신창희 상무는 “클라우드 장애가 나면 서비스 제공자가 책임질 것이라고 생각하기도 하는데, 가용성 클라우드는 공유 책임 모델로, 가용성 및 데이터 보호에 대한 측면은 사용자 책임이라고도 볼 수 있다”고 말했다.
이런 손실을 막기 위해선 장애가 발생하더라도 비즈니스 연속성을 구현할 수 있는 방법을 적용해두는 것이 중요하다. 특히 자체적으로 기업 내부에 클라우드를 구축하지 않고, 서비스 제공업체가 제공하는 인터넷 망을 사용하는 퍼블릭 클라우드 이용 기업들은 별도 자연재해(DR) 솔루션이 필요한 셈이다.
신창희 상무가 언급한 ‘베리타스 인포스케일 솔루션’은 비즈니스 연속성을 위한 클러스터링과 재해 복구 연동을 가능하게 한다. 또한 용도에 맞는 데이터 이중화는 물론 비용은 최소화하는 솔루션이라고 강조했다.
인포스케일은 논리적 스토리지 관리와 데이터 이중화뿐만 아니라 전환 자동화 및 리허설 등을 통해 인프라 복원이 가능하게 한다. 또 HA와 DR을 하나의 개념으로 묶으면, 하나의 클러스터와 DR, 3대가 아닌 2대로 운영과 DR을 가능하게 한다는 설명이다.
일반적인 싱글데이터 베이스는 장애가 났을 때 대기(스탠바이)모드로 전환하는 특징을 갖는다. 이후 스토리지와 불륨 파일 시스템, 애플리케이션 등 전반적으로 필요한 순서대로 전환하는 구조다. 이런 상황에서 데이터 용량에 따라 전환하는 시간이 수분~수십분 소요된다.
시간을 단축 시키기 위해선 병렬DB 옵션이 필요하다. 가령 오라클 DB는 오라클 RAC라는 병렬DB 아키텍처를 제공하고 있다. 다만 오라클 클라우드가 아닌 대부분 퍼블릭 클라우드 서비스 환경에선 지원하지 않는다. 즉 대다수 퍼블릭 클라우드 서비스 사용자들은 복구시간이 ‘제로’에 가까운 오라클 RAC를 옵션으로 택할 수 없다는 의미다.
신 상무는 “베리타스는 인포스케일 기능을 통해 싱글 인스턴스가 장애 낫을 때도 가장 빠르게 전환할 수 있는 아키텍처를 지원할 수 있다”며 “실시간 장애 감지 기능이 있고 오라클 기기를 파일 시스템으로 구현하며 퍼블릭 클라우드 환경에서도 로(raw) 디바이스 성능을 구현한다”고 말했다. 복구시간도 1분 미만으로 빠르다는 게 신 상무 설명이다.
신 상무는 근거리 SAN 미러 기반 데이터 복제도 언급했다. SAN 데이터 미러 구성으로 데이터 미러 복제는 물론이고, 스토리지 장애 시 서비스를 단절 없이 운용할 수 있다는 설명이다. 베리타스는 미러를 제공하는 데 있어 원거리 IP 미러 기반 데이터 복제도 활용한다.
신 상무는 “퍼블릭 클라우드로 전환이 이뤄지고 있는 시점에서 비즈니스 연속성을 위한 HR·DR 기능을 하나의 솔루션으로 구현할 수 있다”며 “컨테이너 환경에 대한 관리 솔루션도 보유하고 있다”고 말했다.