성능RA3 노드 및 관리형 스토리지구체화된 뷰(materialized view)자동화된 성능 튜닝(vaccum)동시성 확장작업(워크로드 매니저 내의 서비스) Redshift 시작하기1. 권한 생성 및 role 생성2. redshift 클러스터 생성컴퓨터 노드 결정: RA3 노드 vs DC노드컴퓨터 노드는 슬라이스로 구성됨(슬라이스들이 병렬 처리함)슬라이스는 컴퓨터 노드 내의 물리적인 구분클러스터 스토리지 용량 = (노드당 스토리지) x (노드 수)리더 노드는 aws가 관리전체 데이터 크기 결정네트워크 설계파라미터 그룹 셋팅3. 데이터 적재(COPY)4. 쿼리 분산 방식-> 데이터 로드하는 방식에 따라서 성능 차이가 생김-> Broadcast 모션 지양하기 (redistribution 은 어느정도 일어날..
AWS Redshift 란- AWS의 데이터웨어하우스 서비스- OLAP성의 관계형 데이터베이스- 완전 관리형, 페타바이트 규모, 엔터프라이즈 등급 구성- PostgreSQl 베이스지만 OLAP 에 맞게 커스토마이징 됨- MPP 구조 (병렬처리)- Columnar (데이터 저장방식이 컬럼 기반) OLTP 와 OLAP의 비교OLTP에서 중요한것은 정합성이어서 정규화 작업이 많이 필요함OLAP 성 업무에서는 목표가 분석이기 때문에 정규화 작업은 많이 필요없지만 분석용이기 때문에 모든 필요한 테이블이 모두 존재하는 것이 중요함(데이터의 중복이 어느정도 허용됨)OLTP와 OLAP 의 스키마 설계 방식은 다를 수 있음 => OLAP도 관계형 데이터베이스기 때문에 스키마 설계가 필요함 데이터웨어하우스란?- 승인되..