본문 바로가기
반응형

Data WareHouse & Data Mart6

SCD테이블 TYPE 1, TYPE 2, TYPE 3, TYPE 4 쿼리(MSSQL) 안녕하세요 투자하는 개발자 투개자입니다.오늘은 SCD 테이블의 TYPE1,2,3,4의 쿼리에 대해 알아보겠습니다.사실 업무를 하면서 쿼리를 저장해두기 위해 쓰는 글이니 SCD 쿼리가 필요하신 분들은 사용하시길 바랍니다, 원본 테이블 CREATE TABLE [dbo].[Client]( [ID] [int] IDENTITY(1,1) NOT NULL, [ClientName] [varchar](150) NULL, [Country] [varchar](50) NULL, [Town] [varchar](50) NULL, [County] [varchar](50) NULL, [Address1] [varchar](50) NULL, [Address2] [varchar](50) NULL, [ClientType] [varchar].. 2020. 9. 28.
EDW, DM(데이터마트) 구축 배경 안녕하세요 투자하는 개발자 투개자입니다.오늘은 EDW(Enterprise DataWarehouse), DM(Data Mart)를 구축을 위한 배경 지식에 대해 이야기해보곘습니다. DW는 왜 필요할까요? DW의 필요성을 설명하기 위해선 OLTP와 OLAP를 알아야합니다. OLTP, OLAP에 대한 설명은 제 블로그에 포스팅되어 있기 때문에 해당 글을 참조해주시면 될 것같습니다.2020/07/15 - [Data WareHouse & Data Mart] - OLTP와 OLAP환경의 차이 서론데이터 웨어하우스, 데이터 마트의 개념은 어떻게 등장하게 된 것일까요? DW, DM의 등장 이유는 BI로 데이터를 시각화 시키기 위함입니다. 그럼 왜 BI가 탄생하게 된것일까요? 이유는 의사결정자들을 위해 탄생하게 되었습니.. 2020. 8. 6.
데이터웨어하우스(DW) 아키텍쳐 비교! 안녕하세요 투자하는 개발자 투개자입니다. 오늘은 데이터웨어하우스의 아키텍쳐에 대해 이야기해볼까합니다. 저번시간에 킴벌과 인본방식의 차이를 알아보았습니다. 오늘은 그분들의 데이터웨어하우스 아키텍쳐에 대해 알아보고 그외 다른 데이터웨어파우스 아키텍쳐가 무엇이 있는지 알아보겠습니다. 1. 킴벌 아키텍쳐킴벌에 아키텍쳐에서 가장 중요한것은 주제영역입니다. 주제별로 DW를 구성하여 각 비즈니스의 주제에 맞게 사용해야한다고 주장했습니다. 서로 다른 이기종의 시스템 데이터에서 키로 연결된 의미있는 데이터를 찾고 해당 데이터를 정규화와 표준화등의 데이터 처리를 거쳐 표준 디멘젼과 팩트를 개발하여 스타스키마를 구축 후 BI화면으로 보여주는 아키텍쳐를 나타냅니다. 이때 디멘젼과 팩트를 개발할 쿼리성능에 따라 BI 퍼포먼스를.. 2020. 8. 4.
[DW&BI] 데이터웨어하우스와 비즈니스인텔리젼스(BI) (킴벌데이터 웨어하우스) 안녕하세요 투자하는 개발자 투개자입니다. 오늘은 킴벌의 이론에 따른 데이터웨어하우스와 BI의 상관관계를 대해 이야기 해보려합니다.데이터웨어하우스라는 모델? 에서 가장 유명한 저자는 킴벌과 인본이라는 사람입니다.이 두명의 이론에 따라 현재까지 DW의 모든 아키텍쳐가 설명된다고 해도 과언이 아닙니다. 이 두명의 DW이론에는 차이가 있습니다. 간략하게 설명드린다면 킴벌은 비즈니스의 주제에 따라 DW를 따로따로 구성해야한다는 것을 강조인본은 비즈니스에 관계없이 기업의 모든 데이터를 DW에 담고 필요할 때 마다 DW안에서 사용하는 점을 강조하고 있습니다. 사실 이 두분의 이론을 전부 이해하려면 400장이 넘는 책을 읽고 이해해야하지만, 오늘은 간략하게만 설명드렸습니다.아무튼 이 두명이 생각하는 DW의 개념이 다르.. 2020. 7. 28.
SCD(Slowly Changing Dimension) 개념 및 종류 안녕하세요 투자하는 개발자 투개자입니다. 오늘은 SCD(Slowly Changing Dimension) 테이블에 대해 이야기하려 합니다.저번글에서 말씀드렸다 싶이 OLAP 환경에서는 이력, 즉 과거, 현재의 개념이 가장 중요합니다.디멘젼 테이블의 궁극적인 목적은 팩트테이블을 설명하는 정보테이블이라고 할 수 있기 떄문입니다. ※팩트테이블 : 값을 나타내는 테이블※디멘젼테이블 : 값을 설명하는 테이블 그렇다면 팩트를 설명하는 디멘젼테이블의 데이터가 바뀌어야만 하는 상황이라면 어떻게 해야할까요?단순히 UPDATE나 DELETE, INSERT를 하면 분석하고자 하는 펙트와 디멘젼이 엉켜버릴 수 있고, 정확한 분석을 할 수 없게 됩니다. 예를들어 설명하겠습니다.A사람은 2020년 1월 1일부터 B회사 영업A팀 부.. 2020. 7. 16.
OLTP와 OLAP환경의 차이 안녕하세요 투자하는 개발자 투개자입니다.오늘은 OLTP와 OLAP환경에 대해 알아보겠습니다.소위 운영계라는 전통적 데이터베이스 시스템에선 OLAP라는 개념이 필요없다고 생각합니다.이유는 한개의 트렌젝션이 발생하고 해당 트렌젝션을 insert, update, delete하는 일련의 과정을 하나의 프로세스로 움직이기 때문에 OLAP을 기반으로하는 정보계와는 다른 정보 저장, 운영에 중요성을 두기 때문입니다.그러나 데이터의 양이 방대해지고 데이터를 통해 insight을 찾으려는 수요가 폭발적으로 증가하면서 정보계 분석의 중요성이 나날이 높아졌습니다. 하여 운영계인 OLTP환경과 정보계인 OLAP환경을 둘다 경험하고 알고 있는 DBA들이 선호되는 추세입니다. 1. OLTP (On-Line Transaction .. 2020. 7. 15.
반응형