事实上,良多人在看到数据仓库的第一眼,就把数据仓库当成了数据库。当然那也很一般,事实从名字来看那两者确实区别不大,实正区分两者的是定位、感化等更深一层的工具。今天我们就来详尽领会一下数据仓库,从概念、特征、长处等方面介绍一下。
数据仓库的概念
数据仓库是一个面向主题的、集成的、随时间改变但信息自己相对不变的数据聚集,用于撑持治理决策过程。其素质就是完成从面向营业过程数据的组织治理到面向营业阐发数据的组织和治理的改变过程,也是贸易智能BI中数据仓库的次要感化。
数据仓库 - 派可数据贸易智能BI可视化阐发平台
数据仓库就像企业的总的大仓库,可以存储差别来源、差别格局的数据,而且能够通过ETL和数据模子,对数据停止高量量的挑选,分级分类停止存储。具有很强的不变性,不会频繁的停止增删改等操做,可以反响汗青改变。
用通俗的话来说就是数据仓库就像一个末端的大仓库,其他小仓库的各类货品会通过各类体例同一存储到那里,然后通过仓库位置的划分、货品的摆放停止回纳分类,实现标准、原则的从存放,到分类,再到利用的完全过程。
数据仓库的特征
1.主题性
数据仓库是一般从用户现实需求动身,将差别平台的数据源按设定主题停止划分整合,与传统的面向事务的操做型数据库差别,具有较高的笼统性。
2.集成性
数据仓库中存储的数据大部门来源于传统的数据库,但并非将原有数据简单的间接导进,而是需要停止预处置。那是因为事务型数据中的数据一般都是有噪声的、不完全的和数据形式不同一的。那些“脏数据”的间接导进将对在数据仓库根底长进行的数据发掘形成紊乱。“脏数据”在进进数据仓库之前必需颠末抽取、清洗、转换才气生成从面向事务转而面向主题的数据聚集。数据集成是数据仓库建立中最重要,也是最为复杂的一步。
贸易智能BI- 派可数据贸易智能BI可视化阐发平台
展开全文
3.不变性
数据仓库中的数据次要为决策者阐发供给数据根据。决策根据的数据是不容许停止修改的。即数据保留到数据仓库后,用户仅能通过火析东西停止查询和阐发,而不克不及修改。数据的更新晋级次要都在数据集成环节完成,过时的数据将在数据仓库中间接筛除。
4.动态性
数据仓库数据会随时间改变而按期更新,不成更新是针对利用而言,即用户阐发处置时不更新数据。每隔一段固定的时间间隔后,抽取运行数据库系统中产生的数据,转换后集成到数据仓库中。跟着时间的改变,数据以更高的综合条理被不竭综合,以适应趋向阐发的要求。当数据超越数据仓库的存储期限,或对阐发无用时,从数据仓库中删除那些数据。
数据仓库建模体例
在Kimball和Inmon两位数据仓库范畴大佬差别标的目的的体味批示下,数据仓库的建模已经是一个成熟的系统,能够根据需求抉择差别的体例,既有三范式 3NF 建模,也有维度建模好比星型或雪花型的建模体例。
数据仓库 - 派可数据贸易智能BI可视化阐发平台
数据仓库还有着分层构造,每个分层构造都有各自的感化,好比经常看到的ODS 层、Trans 层、Dimension 层、Data Mart 层等,都是为了将数据从大海中停止挑选,从分离到集中停止高度汇总,构成一个个的主题,为后续的前端数据可视化阐发供给数据的支持。
数据仓库为了营业阐发的目标,因而需要拉通各个营业系统数据库的数据,保留大量汗青数据,同时为了阐发效率的提拔改动了传统数据库的数据组织形式,例如操纵合适于阐发型模子的Kimball维度建模体例来组织底层数据架构。
数据可视化阐发 - 派可数据贸易智能BI可视化阐发平台
数据仓库办事于贸易智能BI阐发,通过贸易智能BI前端可视化阐发东西来拜候,是此中不成或缺的一部门。而且在持久的建立中,贸易智能BI已经构成了一套间接零代码设置装备摆设并完成数仓建模的整个过程,停止了完全的产物化,处理了困难的架构与模子的问题。
数据仓库做为贸易智能BI系统中的一部门,已经生长为了企业信息化建立中必不成少的重要支持,在可见的将来,数据仓库还会跟着信息化、数字化手艺、理念、利用的落地,陆续生长。
数据仓库的长处
1、供给加强的贸易智能(BI)
操纵从各类数据源供给的数据,治理人员和高管们将不再需要凭着有限的数据或他们的曲觉做出贸易决策。此外,“数据仓库及相关贸易智能(BI)可间接用于包罗市场细分、库存治理、财政治理、销售如许的营业流程中。”
2、可节约时间
营业用户能够在一个处所快速拜候许大都据源,他们就在关键计划上敏捷做出知情的决策,而不会用浪费贵重的时间从多种数据源中检索数据。
不只如斯,营业主管们能够在很少或者底子没有IT的撑持下本身查询数据—节约了更多的时间和资金。
贸易智能BI - 派可数据贸易智能BI可视化阐发平台
3、能进步数据的量量和一致性
一个数据仓库的施行包罗将数据从浩瀚的数据源系统直达换成配合的格局。因为每个来自各个部分的数据被原则化了,每个部分将会产生与所有其它部分契合的成果。所以你能够对你数据的准确性更有自信心。而准确的数据是强大的贸易决策的根底。
4、能供给汗青的伶俐
一个数据仓库贮存了大量的汗青数据,所以你能够通过火析差别的期间和趋向来做出对将来的揣测。那些数据凡是不克不及被存储在一个交易型的数据库里或用来从一个交易系统中生成报表。
5、能创建高的投资回报率
最初,最值得一提的是投资回报率。已经安拆了数据仓库和完美了贸易智能(BI)系统的企业比没有在贸易智能(BI)系统和数据仓库投资的企业能产生更多的利润和节约更多的资金。而那应该成为高级治理层快速加进到数据仓库那个潮水中的足够理由。