AWS 장애 원인은 개발자 실수…“재발 방지 노력”

클라우드 서비스

디지털데일리 발행일 2017-03-03 14:29:38

백지영

[디지털데일리 백지영기자] 최근 발생한 아마존웹서비스(AWS)의 서비스 장애는 개발자의 실수 때문인 것으로 알려졌다.

앞서 지난 28일 AWS의 미국 동부-1 지역의 스토리지 서비스(S3)에 장애가 발생하면서 약 11시간 동안 이를 이용하는 다수의 웹사이트 등이 다운되거나 느려지는 피해를 입었다. S3와 연계된 엘라스틱블록스토어(EBS), 람다 등 여러 서비스도 제대로 작동하지 않았다.

2일(미국 현지시각) AWS는 자사 홈페이지를 통해 “S3 과금시스템이 느리게 진행되는 문제를 해결하는 과정에서 공인된 S3팀의 구성원이 기존 플레이북을 사용해 S3 결제 프로세스에서 사용되는 서브시스템 중 하나를 위해 다수의 서버를 삭제하는 명령(커맨드)을 실행하면서 문제가 발생했다”고 사과했다.

즉, 잘못된 명령어 입력을 통해 여러대의 서버를 삭제하면서 S3 서브시스템을 지원하는 다수의 서버가 다운된 것이다. 이에 따라 AWS 미국 동부-1 지역의 S3 서브시스템을 새롭게 시작해야 했고, 예상보다 시간이 오래 걸렸다는 설명이다.

AWS는 이번 장애로 내부 툴과 프로세스 절차를 바꿨다고 밝혔다. 툴이 용량을 좀 더 느리게 제거하도록 수정했으며, 세이프가드 기능을 추가해 서브시스템의 최소 필요 용량 밑으로 제거되는 것을 방지했다. 또 장애가 발생한 노던버지니아(미국 동부-1)의 데이터센터에서만 돌아가던 AWS의 서비스 헬스 대시보드도 여러 리전에서 구동되도록 바꿨다.

<백지영 기자>jyp@ddaily.co.kr

백지영

jyp@ddaily.co.kr

기자의 전체기사 보기

이 기사와 관련된 기사

당신이 좋아할 만한 뉴스

연재기사

정책

정부, 첨단 GPU 연내 1만장 확보 나선다…올 10월 서비스 개시
e비즈*솔루션

[AWS 서밋 서울] “피부 진단도, 골프 코칭도 다 해드립니다”…‘생활밀착’ AI의 향연
e비즈*솔루션

LG CNS, ‘AWS 서밋 서울’서 AX 기술역량 총결집
e비즈*솔루션

가비아, ‘가비아 클라우드’로 리브랜딩…이름·요금체계 전면 개편

실시간 추천 뉴스

정부, 첨단 GPU 연내 1만장 확보 나선다…올 10월 서비스 개시
2025-05-14 16:45:36
[AWS 서밋 서울] “피부 진단도, 골프 코칭도 다 해드립니다”…‘생활밀착’ AI의 향연
2025-05-14 16:35:58
LG CNS, ‘AWS 서밋 서울’서 AX 기술역량 총결집
2025-05-14 16:35:36
가비아, ‘가비아 클라우드’로 리브랜딩…이름·요금체계 전면 개편
2025-05-14 16:35:20
[버추얼이 간다②] 버추얼이 인간 앞선다..."K-팝·인방계도 접수 완료"
2025-05-14 16:32:39

회사명: ㈜디지털데일리｜제호: 디지털데일리｜등록번호 : 서울아00039｜등록발행연월일: 2005년 9월 6일｜사업자 등록번호: 101-86-13419
주소: (04057)서울특별시 마포구 신촌로14길 24(노고산동 54-46)｜대표전화: 02-334-7781｜Fax: 02-334-7782
대표자: 양경진｜편집국장: 채수웅｜개인정보·청소년보호책임자: 오주엽

뉴스

뉴스

기획/특집

부가서비스

이 기사와 관련된 기사

당신이 좋아할 만한 뉴스

많이 본 기사

연재기사

실시간 추천 뉴스