본문 바로가기

AWS

Amazon Redshift

728x90

Amazon Redshift

: 표준 SQL과 기존 비즈니스 인텔리전스 도구를 사용하여 모든 데이터를 간편하고 비용효율적으로 분석할 수 있는 완전관리형의 고속 데이터 웨어하우스(창고?)

 

분석!은 오늘날 비즈니스에 중요한 부분, 데이터 웨어하우스를 구축하기 복잡하고 비용이 많이 든다!

데이터 웨어하우스를 설정하는데 몇 달이 걸리고 상당한 금전적 리소스가 소요됨

-> Amazon Redshift는 단순하고 비용 효율적으로 설정하고 사용할 수 있는 빠르고 강력한 완전 관리형 데이터 웨어하우스

-> 확장과 축소도 경제적으로 할 수 있다

 

Q. 데이터 웨어하우스가 뭐고, 왜 필요해?

A. 의사결정에 도움을 주기 위해 분석가능한 형태로 변환한 데이터들이 저장되어 있는 중앙 저장소

대규모 데이터 분석작업을 처리하는데 한계가 있어서 데이터웨어하우스가 필요하다

 

 

장점

- 정교한 쿼리 최적화

- 고성능 로컬 디스크의 열 형식 스토리지

- 대량 병령 실행 기능을 사용하여 페타바이트 규모의 정형 데이터에 복잡한 분석 쿼리 실행 가능(결과가 몇 초만에 반환됨)

 

구현

리더 및 컴퓨팅 노드의 클러스터로 구성됨

리더 노드는 클라이언트 프로그램과의 통신, 컴퓨팅 노드와의 모든 통신 관리

- 복잡한 쿼리에서 결과를 얻는 데 필요한 일련의 단계를 수행하는 실행 계획을 분석하고 개발

- 실행 계획의 개별요소에 대한 코드를 컴파일하여 각 컴퓨팅 노드에 해당 코드를 할당

 

컴퓨팅 노드는 컴파일된 코드를 실행한 후, 최종 집계를 위해 중간 결과를 리더 노드로 다시 보냄

 

비용은 사용한 만큼만 지불!

 

클러스터의 관리 모니터링, 크기 조정에 필요한 대부분의 일반적인 관리 작업을 자동화할 수 있음

확장성은 내장되어 있는데 콘솔에서 클릭 몇 번으로 필요에 따라 클러스터를 확장/축소 가능

보안을 기본적으로 보장, 저장/전송 데이터에 대해 강력한 암호화 제공

호환성 : 표준 SQL 지원, 고성능 Java 데이터베이스 연결 및 개방형 데이터베이스 연결 커넥터 제공

->원하는 SQL 클라이언트 및 비즈니스 인텔리전스 도구를 사용하여 Redshift 클러스터에 연결 가능. 콘솔이나 CLI를 통해 직접 클러스터와 상호 작용 가능

 

사용 사례

EDW(엔터프라이즈 데이터 웨어하우스)

  • - 고객이 편한 속도로 마이그레이션 -> 민첩성 개선 가능
  • - 대규모 초기 비용이나 약정 없이 실험
  • - 비즈니스 요구에 더욱 신속하게 대응
  • 빅데이터
  • - 데이터 양이 기존 시스템의 한계점에 이를 정도로 방대하기 때문에 소규모 고객이 저렴한 가격으로 데이터 웨어하우스를 신속하게 구축하고 사용 가능
  • - 관리형 서비스로서 데이터베이서 관리보다 데이터에 더 집중 가능

SaaS(서비스형 소프트웨어)

  • - 데이터 웨어하우스 용량 확장 가능
  • - 애플리케이션에 분석 기능 추가
  • - 하드웨어, 소프트웨어 비용 절감

 

 

 

728x90