전 세계 1위 퍼블릭 클라우드인 아마존웹서비스(AWS)에서 22일 오전 접속 장애가 발생, AWS에 기반을 둔 국내 IT 서비스가 동시에 마비됐다.

아마존웹서비스(AWS) 로고
아마존웹서비스(AWS) 로고
이번 AWS 접속 장애는 전 세계적인 상황이 아닌 국내에서만 발생한 것으로 나타났다. 오전 8시경(관련기사)부터 AWS의 주요 서비스인 EC2(Elastic Compute Cloud)의 서울 리전(Region, 아마존 지역 데이터센터 명칭)에서 내부 DNS(Domain Name System) 변환에 실패해 외부 접속이 불가능한 DNS 오류가 발생했으며, 이후 아마존의 다른 클라우드 서비스로 장애가 확산된 것으로 드러났다.

특히 이번 장애로 AWS 서울 리전만 단독으로 이용하는 기업들의 피해가 큰 것으로 나타났다. 서울 리전 외에 일본, 싱가포르 등 다른 지역 리전을 동시에 이용하는 멀티클라우드를 적용한 기업들의 경우 AWS를 이용함에도 장애를 겪지 않은 것으로 나타났다.

AWS 대시보드 현황에 따르면 21일 12시 이후 EC2를 비롯한 AWS 일부 서비스의 장애는 대부분 해결된 상태다. 그러나 오류가 발생한 정확한 원인에 대한 AWS 및 AWS코리아의 공식적인 해명은 아직 없는 상황이다.

이번 AWS 장애로 인해 쿠팡, 마켓컬리 등 온라인 쇼핑몰과 배달의민족, 야놀자, 여기어때 등 웹 기반 서비스(관련기사), 업비트와 코인원 등 암호화폐 거래소(관련기사), 스마일게이트, 라인게임즈를 비롯한 게임회사, 푹(POOQ) 등 온라인 영상 플랫폼, 일부 온라인 금융서비스 등 업종에 상관없이 AWS를 이용하는 서비스의 상당수가 22일 오전 내내 접속 불가 문제를 겪었다.

AWS 접속 장애로 인한 22일 오전 9시경 배달의 민족 및 쿠팡 접속 장애 모습. / IT조선 DB
AWS 접속 장애로 인한 22일 오전 9시경 배달의 민족 및 쿠팡 접속 장애 모습. / IT조선 DB
해당 온라인 쇼핑업체와 음식주문 서비스 업체 등은 복구 완료 후 피해 상황 파악 등 후속 조치에 나서고 있다. 입점한 판매자의 경우 장애가 발생한 시간 동안 광고가 노출되지 않고 주문이 지연되면서 피해가 발생했을 것으로 예상된다.

음식 주문 배달 서비스 업체인 배달의민족 측은 "음식 주문이 많지 않은 시간대라 상대적으로 피해 규모는 적은 편"이라며면서도 "업체에서 광고 노출이 안 된 것 등을 두고 피해보상을 요구할 수도 있다. 이런 것까지 모두 포함해 피해액을 추산할 예정"이라고 말했다.

종합 숙박 예약 서비스 업체인 여기어때도 자체 대응을 통해 서비스를 복구한 뒤 피해 상황을 확인 중이다. 여기어때 측은 "접속 자체가 안돼 제휴점주들이 일정 시간 동안 광고 노출이 안 됐다는 지점에 대해 불만이 있었을 것"이라며 "서비스 접속 장애로 고객도 결제 중 오류가 발생했을 수 있어 고객센터로 들어온 문의를 중심으로 피해 상황을 종합하고 있다"고 말했다.

◇ 피해 확산 원인은 지나친 ‘단일 리전’ 의존

AWS의 장애가 비단 국내에서만 있던 것은 아니다. 해외에서 발생한 가장 최근의 대형 장애 사례는 2018년 3월 미국 동부 리전(버지니아 애쉬번)에서 발생한 서비스 중단이다.

당시 아마존에 따르면 정전으로 인해 데이터센터 서버 일부가 피해를 입으며 ‘AWS 다이렉트 커넥트’ 서비스에서 패킷 손실이 발생, 미국 동부지역을 중심으로 약 4시간 동안 240여개의 AWS 기반 엔터프라이즈 서비스에 장애가 발생했다. 같은 클라우드를 이용하는 아마존의 인공지능 비서 서비스 알렉사(Alexa) 역시 약 4시간 가까이 장애가 발생했던 것으로 나타났다.

아마존 서비스 헬스 대시보드 현황. 접속 장애는 서울 리전에서만 발생했으며, 모두 해결된 상태다. / 아마존웹서비스 갈무리
아마존 서비스 헬스 대시보드 현황. 접속 장애는 서울 리전에서만 발생했으며, 모두 해결된 상태다. / 아마존웹서비스 갈무리
이번 AWS 장애로 인해 피해를 입은 기업들의 경우 대부분 AWS 서울 리전 한 곳을 통해서만 클라우드 서비스를 이용한 것으로 나타났다. 레진코믹스처럼 AWS를 이용하지만 2곳 이상의 클라우드를 동시에 사용하는 멀티클라우드를 구축한 기업들은 이번 접속 장애 문제를 겪지 않았다.

한 곳의 클라우드에만 100% 의존하는 경우, 해당 클라우드에 장애가 발생하면 이용 기업들은 완전히 복구가 완료될 때까지 기다릴 수밖에 없다. 해외의 경우 크고 작은 장애 이슈로 인해 장애가 발생해도 대처할 수 있는 멀티 클라우드, 하이브리드 클라우드 도입에 대한 관심이 높아지는 상황이다.

그러나 국내의 경우 아직 클라우드 관련 시장이 초기 단계이고 장애 사례도 많지 않아 멀티클라우드의 필요성에 대한 인식이 낮은 데다, 멀티클라우드 운영으로 인한 추가 비용 부담으로 인해 단일 클라우드만 사용하는 경우가 많다는 게 업계 관계자들의 말이다.

◇ 국내 시장 공략 강화하던 AWS, 이번 장애로 ‘역풍’ 맞나

2016년 서울 리전을 세우고 국내에서 공격적으로 클라우드 사업 확대에 나선 AWS는 이번 접속 장애 사태로 국내 진출 이후 최대 위기에 봉착했다.

접속 장애를 겪은 국내 AWS 이용 기업들의 구체적인 장애 원인 해명 요구와 재발 방지책 마련, 장애로 인한 피해 보상 요청 등이 이어질 것으로 예상되면서 AWS가 구상하는 국내 사업 계획에도 차질이 발생할 것으로 보인다.

또한, 유수의 기업들이 입지를 확대하려는 국내 클라우드 시장이 AWS에게 녹록치만은 않은 상황이다. 국내 데이터센터를 구축한 마이크로소프트 애저(Azure)를 비롯해 기존 데이터센터 선두업체인 IBM과 오라클 등도 국내 클라우드 사업을 확대하고 있다. 포털 서비스를 기반으로 국내는 물론 해외 진출까지 노리는 네이버와 통신사업을 기반으로 클라우드 사업을 확대하고 있는 KT 등 국내 기업들과도 클라우드 시장에서 치열한 접전을 벌이고 있다.

예기치 못한 ‘세계 1위 클라우드 기업’ AWS의 이번 접속 장애는 AWS를 비롯한 퍼블릭 클라우드 서비스 기업들의 신규 고객사 확보는 물론, 국내 클라우드 시장의 성장에 부정적인 영향을 끼칠 전망이다.

한편, 시장조사기관 가트너에 따르면 국내 클라우드 시장 규모는 올해 2조원 대에서 2019년 2조4400억원 규모로 성장할 전망이다. 전 세계 클라우드 시장은 2018년 1758억 달러(약 198조5000억원)에서 2019년은 17.3% 증가한 2062억 달러(약 232조8000억원) 규모에 이를 전망이다. AWS의 시장 점유율은 41%로 업계 1위다.