DW 개념과 정의
아래는 예제 데이터베이스인 AdventureWorks에서 Production 스키마를 가진 테이블의 관계를 표시한 것이다.
이 관계를 보고 제품과 관련된 원하는 데이터를 빨리 찾을 수 있겠는가?
이러한 구조는 데이터를 빨리 찾아 분석하기 위한 데이터 구조로는 적합하지 않다.
따라서 분석을 위한 데이터 저장소의 구조는 보다 쉽고 신속하게 데이터를 획득할 수 있는 구조를 가져야 한다.
이러한 분석에 용이한 구조를 DW는 가지고 있다.
1. DW는 Data Warehouse의 약자
2. DW는 특별한 형태의 구조를 가진 통합 데이터 저장소
3. OLTP와 같이 정규화되어 엄청나게 분리되어 저장된 구조가 아닌, 사용자가 쉽게 이해할 수 있고
최소한의 조인으로 원하는 결과를 얻을 수 있는 매우 단순화된 구조
4. 쉽고 간단한 방법으로 원하는 데이터를 획득할 수 있는 구조
스키마
DW는 사용자가 쉽게 인지하고 사용할 수 있는 구조를 가지고 있다.
특별한 형태의 구조를 가지고 있어 그것이 가능한데, 주로 많이 사용하는 스키마에는
스타 스키마와 눈송이 스키마가 있다.
1. 스타 스키마
- 차원(Demension) 테이블과 팩트(Fact) 테이블로 구성되어 있다.
- 팩트 테이블이란 분석의 대상이 되는 데이터가 저장된 곳이다.
- 차원 테이블은 분석의 관점이 되는 데이터가 저장된 곳이다.
- 차원 테이블은 일반적으로 OLTP에서 정규화되어 분리되어 있는 테이블을 합쳐 정규화되지 않은
형태로 저장하는 것이 특징이다.
- 최대 장점은 원하는 정보가 주제별로 하나의 테이블에 다 정리되어 있다는 점이다.
- DW는 데이터를 코드화하지 않고 그 값 자체를 저장하기 때문에 따로 참조할 정보가 줄어든다.
예를 들어 성별이라는 값은 보통 M, F와 같이 코드화할 수 있지만 DW에서는 Man, Female과 같은
그 값 전체를 기술하는 것을 좋아한다.
2. 눈송이 스키마
- 스타 스키마에서 일부 차원 테이블이 정규화된 형태를 가지고 있다.
- 저장 공간을 절약할 수 있고, 경우에 따라 쿼리 성능이 향상될 수 있다.
- 속성의 개수가 가변적인 항목의 처리에 상당한 강점이 있다.
- 스타 스키마 보다 정보가 흩어져 저장되어 있으므로 덜 직관적인 구조를 가진다.
참고 : 권태돈과 함께하는 SQL Server 2012 BI
'BI > DW' 카테고리의 다른 글
[DW] 차원 모델링 (0) | 2014.01.28 |
---|