Auto Scaling

기술노트
Admin (토론 | 기여)님의 2025년 8월 10일 (일) 14:44 판 (IT 용어 자동 업로드: Auto Scaling)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)

Auto Scaling

비유로 쉽게 이해하기

Auto Scaling은 **'상황에 따라 계산대를 자동으로 늘리거나 줄이는 마트 매니저'**와 같습니다. 손님이 몰리면(트래픽 증가) 계산대(EC2 인스턴스)를 즉시 추가로 열어 대기 줄을 줄이고, 손님이 빠지면(트래픽 감소) 불필요한 계산대를 닫아 인건비(비용)를 절약합니다. 이 모든 것을 매니저가 24시간 지켜보며 자동으로 처리해 줍니다.

개요

Amazon EC2 Auto Scaling은 애플리케이션의 부하에 맞춰 EC2 인스턴스의 수를 자동으로 조정하여 애플리케이션의 가용성을 유지하고 비용을 최적화하는 서비스입니다.

상세 설명

Auto Scaling은 사용자가 정의한 조건에 따라 EC2 인스턴스 그룹의 크기를 자동으로 늘리거나(Scale-out) 줄입니다(Scale-in). 예를 들어, '모든 인스턴스의 평균 CPU 사용률이 70%를 넘으면 인스턴스 2대를 추가하고, 30% 아래로 떨어지면 1대를 제거하라'와 같은 규칙을 설정할 수 있습니다.

이러한 규칙은 CloudWatch 모니터링 메트릭을 기반으로 하며, CPU 사용률 외에도 네트워크 트래픽, 요청 수 등 다양한 지표를 기준으로 설정할 수 있습니다. 또한, 특정 시간에 따라 인스턴스 수를 조절하는 '예약 스케일링'도 가능합니다. (예: 매일 오전 9시에 인스턴스를 늘리고, 오후 6시에 줄임)

왜 중요할까요?

  • 안정적인 서비스 운영: 갑작스러운 트래픽 폭증에도 자동으로 서버를 증설하여 서비스가 다운되는 것을 방지합니다.
  • 비용 최적화: 필요한 만큼만 인스턴스를 운영하므로, 불필요한 유휴 자원에 대한 비용을 낭비하지 않습니다.
  • 자동화된 관리: 수동으로 인스턴스를 관리하는 수고를 덜어주어 운영 효율성을 높입니다.

주요 특징

  • 자동 인스턴스 관리: 정의된 정책에 따라 EC2 인스턴스 수를 자동으로 늘리거나 줄입니다.
  • 다양한 스케일링 정책: 대상 추적 스케일링, 단계별 스케일링, 예약 스케일링 등 다양한 시나리오에 맞는 정책을 제공합니다.
  • 상태 확인(Health Check): 비정상적인 인스턴스를 감지하면 자동으로 종료하고 새로운 정상 인스턴스로 교체하여 서비스의 안정성을 유지합니다.
  • ELB와의 통합: 새로 생성된 인스턴스를 자동으로 로드 밸런서에 등록하여 트래픽을 분산시킵니다.

사용 사례

  • 트래픽 변동이 심한 e-커머스 웹사이트
  • 대규모 마케팅 캠페인 또는 라이브 이벤트 진행
  • 주기적으로 대량의 데이터를 처리하는 배치 작업
  • 예측 불가능한 트래픽을 가진 신규 서비스

관련 서비스/용어