안녕하세요 투자하는 개발자 투개자입니다.
오늘은 킴벌의 이론에 따른 데이터웨어하우스와 BI의 상관관계를 대해 이야기 해보려합니다.
데이터웨어하우스라는 모델? 에서 가장 유명한 저자는 킴벌과 인본이라는 사람입니다.
이 두명의 이론에 따라 현재까지 DW의 모든 아키텍쳐가 설명된다고 해도 과언이 아닙니다.
이 두명의 DW이론에는 차이가 있습니다. 간략하게 설명드린다면
킴벌은 비즈니스의 주제에 따라 DW를 따로따로 구성해야한다는 것을 강조
인본은 비즈니스에 관계없이 기업의 모든 데이터를 DW에 담고 필요할 때 마다 DW안에서 사용하는 점을 강조하고 있습니다.
사실 이 두분의 이론을 전부 이해하려면 400장이 넘는 책을 읽고 이해해야하지만, 오늘은 간략하게만 설명드렸습니다.
아무튼 이 두명이 생각하는 DW의 개념이 다르다고 볼 수 있습니다. 또한 컴벌파와 인본파로 나누어질 만큼 DW에서의 이 두분의 영향력은 막강합니다.
오늘은 킴벌이 작성한 데이터_웨어하우스_킴벌 툴킷 책에 따라 킴벌이 강조하는 DW와 BI의 상관관계를 알아보겠습니다.
1. 데이터웨어하우스
데이터 웨어하우스의 사전적 정의는 사용자의 의사결정에 도움을 주기 위해 다양한 시스템에서 데이터를 추출, 변환, 요약해 동적으로 사용자에게 제공할 수 있는 데이터베이스의 집합체입니다.
기업에서는 자신들이 사용하는 시스템이 나누어져 있습니다. 예를 들면 ERP, 인적관리시스템, 사업분야 관리 시스템 등을 말합니다.
이러한 시스템의 데이터들이 유기적으로 연관이 있고, 해당 데이터로 의사결정에 도움이 될 것이라는 전제하여 데이터를 하나로 뭉쳐놓는 공간이라고 생각하시면 됩니다.
2. 비즈니스 인텔리젼스(BI)
BI의 사전적 적의는 기업의 데이터를 수정, 정리, 분석해서 효율적인 의사결정을 할 수 있는 방법에 대해 연구하는 학문입니다.
학문이라고 정의하고 있지만, 보통은 각 비즈니스에 해당하는 데이터를 활용해 경영인의 전략을 세우는데 도움이 되는 기술이라고 생각하시면 됩니다.
경영인들이 데이터를 통해 정보를 얻기 위해선 데이터가 쉽게 눈으로 볼 수 있어야합니다. 그래서 나온것이 BI 툴입니다. 현재는 PowerBI, Tableau와 같은 툴이 있습니다.
킴벌은 DW와 BI에 대해서 "DBA와 MBA에 대한 지식이 반반씩 있어야한다"라고 말했습니다. 즉 기술뿐아니라 비즈니스를 반드시 이해해야 DW와 BI프로젝트의 목표를 달성할 수 있다고 주장합니다. 이런 이유는 킴벌의 DW/BI는 비즈니스를 이해하는데서 출발한다고 말하기 때문입니다.
실제 킴벌의 저서를 읽어보면 각 산업별로 DW/BI를 구분지어 설명하고 있습니다. 비즈니스를 주제로 연관짓고 주제에 따라 데이터를 다루는 것이 달라진다고 설명하고 있습니다. 이속에서 팩트와 디멘젼이 탄생하고, 스타스키마로 데이터 아키텍쳐를 설계해야 퍼포먼스와 킴벌에 주장하는 데이터웨어하우스의 모델이 탄생한다고 말합니다.
팩트, 디멘젼, 스타스키마, 스노우플레이크 스키마는 다음시간에 이어서 설명드리겠습니다.
결국 킴벌의 DW와 BI의 상관관계는 데이터를 구성하는 것도 중요하지만 현재 구축하고자 하는 산업에 따라 바뀌어야하며 비즈니스를 기준으로 DW를 구성해야한다고 이해하시면 됩니다!
'Data WareHouse & Data Mart' 카테고리의 다른 글
SCD테이블 TYPE 1, TYPE 2, TYPE 3, TYPE 4 쿼리(MSSQL) (0) | 2020.09.28 |
---|---|
EDW, DM(데이터마트) 구축 배경 (0) | 2020.08.06 |
데이터웨어하우스(DW) 아키텍쳐 비교! (0) | 2020.08.04 |
SCD(Slowly Changing Dimension) 개념 및 종류 (0) | 2020.07.16 |
OLTP와 OLAP환경의 차이 (0) | 2020.07.15 |