본문 바로가기

AWS

AWS Well-Architected 프레임워크의 세번째 : 안정성 원칙

728x90

AWS Well-Architected 프레임워크의 세번째 : 안정성 원칙

 

안정성 원칙

: 인프라나 서비스 장애로부터 복구하고, 수요에 맞춰 컴퓨팅 리소스를 동적으로 확보하며 잘못된 구성이나 일시적인 네트워크 문제와 같은 중단을 완화하는 시스템의 기능에 중점을 둠

 

- 설정

- 교차 프로젝트 요구 사항

- 복구 계획

- 변경 처리

 

안정성을 높일 수 있는  5가지 설계 원칙

1. 복구 절차 테스트

- 시스템 장애를 테스트, 복구 절차를 검증

-> 장애 경로를 파악하여 실제 장애 시나리오가 발생하기 전에 테스트하고 교정할 수 있음

2. 장애 발생 시 자동으로 복구하는 기능 마련하기

- 시스템의 주요 성능 지표를 모니터링, 임계값 위반 시 자동 복구를 트리거하도록 시스템 구성

-> 자동 알림, 장애 추적 기능을 활성화하고 장애를 해결하거나 복구하는 자동 복구 프로세스를 지원할 수 있음

3. 수평적 확장을 통해 전체 시스템의 가용성을 높임

- 단일의 대규모 리소스를 다수의 소규모 리소스로 대체

- 이러한 소규모 리소스에 요청을 분산하여 단일 지점의 장애가 전체 시스템에 미치는 영향을 줄임

4. 용량 추정 불필요

- 수요, 시스템 사용량을 모니터링하고 리소스 추가나 제거를 자동화해서 수요를 충족하는 최적의 수준을 유지

5. 변경 관리 자동화

- 자동화를 사용하여 인프라 변경을 수행

- 자동화를 통해 변경 관리

 

안정성에 대한 기본적인 질문은 기반, 변경 관리, 장애 관리로 알려진 3가지 모범 사례 영역과 관련됨

- 안정성을 달성하려면 시스템에 제대로 계획된 기반과 모니터링 기능이 있어야함

- 수요나 요구 사항의 변경을 처리하는 메커니즘이 있어야함

- 시스템은 장애를 감지하고 자동으로 자가 복구를 수행하도록 설계되어야함

 

728x90