Multi-AZ (Multi-Availability Zone)

기술노트

Multi-AZ (Multi-Availability Zone)

비유로 쉽게 이해하기

Multi-AZ는 **'중요한 서류를 두 개의 다른 금고에 똑같이 복사해두는 것'**과 같습니다. 한쪽 금고에 불이 나거나 문제가 생겨도(하나의 가용 영역 장애), 다른 쪽 금고에 있는 서류는 안전하게 보관되어 업무를 계속할 수 있습니다. AWS는 이 과정을 자동으로 처리해주어, 한쪽 데이터 센터에 문제가 생겨도 서비스가 중단되지 않도록 합니다.

개요

Multi-AZ(다중 가용 영역) 배포는 애플리케이션의 안정성과 가용성을 높이기 위해, 여러 개의 독립된 가용 영역(Availability Zone)에 걸쳐 리소스를 배포하고 운영하는 아키텍처 패턴입니다.

상세 설명

가용 영역(AZ)은 하나의 AWS 리전(Region) 내에 존재하는, 물리적으로 분리된 데이터 센터 또는 데이터 센터의 그룹입니다. 각 AZ는 독립적인 전력, 냉각, 네트워크 설비를 갖추고 있어 하나의 AZ에서 장애가 발생해도 다른 AZ에 영향을 미치지 않도록 설계되었습니다.

Multi-AZ 아키텍처는 이러한 AZ의 격리성을 활용합니다. 예를 들어, RDS 데이터베이스를 Multi-AZ로 배포하면, 주 데이터베이스(Primary)와는 다른 AZ에 동일한 복제본(Standby)이 실시간으로 생성 및 유지됩니다. 평소에는 주 데이터베이스만 사용하다가, 만약 주 데이터베이스가 있는 AZ에 장애가 발생하면 AWS가 자동으로 복제본을 새로운 주 데이터베이스로 승격시켜 서비스를 몇 분 내로 재개합니다. 이 과정을 장애 조치(Failover)라고 합니다.

왜 중요할까요?

  • 고가용성 확보: 특정 데이터 센터의 정전, 네트워크 문제 등 물리적인 장애가 발생하더라도 서비스 중단을 최소화하고 비즈니스 연속성을 보장합니다.
  • 데이터 보호: 실시간 데이터 복제를 통해 예기치 않은 장애 상황에서도 데이터 손실을 방지합니다.
  • 유지보수 중단 최소화: 데이터베이스 패치 등의 유지보수 작업 시, 복제본에서 먼저 작업을 수행한 후 장애 조치를 통해 서비스 중단 시간을 최소화할 수 있습니다.

주요 특징

  • 고가용성 보장: 단일 장애 지점(SPOF)을 제거하여 서비스의 안정성을 크게 향상시킵니다.
  • 자동 장애 조치(Failover): 장애 발생 시 수동 개입 없이 자동으로 복제본으로 전환됩니다.
  • 데이터 동기식 복제: 주 데이터베이스에 데이터가 기록될 때, 복제본에도 동시에 기록되어 데이터의 일관성을 유지합니다. (주로 RDS의 경우)

사용 사례

  • 24시간 중단 없이 운영되어야 하는 온라인 쇼핑몰의 데이터베이스
  • 금융 거래와 같이 데이터의 신뢰성과 가용성이 매우 중요한 시스템
  • 기업의 핵심 업무를 처리하는 ERP, CRM 시스템
  • ELB를 사용하여 여러 AZ에 걸쳐 웹 서버를 배포하고, 하나의 AZ 장애에 대비

관련 서비스/용어