聊聊数据仓库是什么

3天前 (02-24 07:51)阅读1回复0
小强
小强
  • 管理员
  • 注册排名8
  • 经验值130130
  • 级别管理员
  • 主题26026
  • 回复0
楼主

跟着数据通过各类体例创造了浩荡价值,各范畴的企业起头不竭发掘数据的感化,数据的重要性得到了社会各界的配合承认。像我们熟知的数据治理、数据治理、数据原则以及数据资产都是因为数据地位不竭提拔,企业起头重视起数据全生命周期流程,才起头在企业内大规模施行的。因而,领会数据仓库就尤为重要了。

数据仓库是什么

事实上,良多人在看到数据仓库的第一眼,就把数据仓库当成了数据库。当然那也很一般,事实从名字来看那两者确实区别不大,实正区分两者的是定位、感化等更深一层的工具。不外在那里仍是先阐明数据仓库的概念,差别之处后边会停止详尽讲解。

数据仓库是一个面向主题的、集成的、随时间改变但信息自己相对不变的数据聚集,用于撑持治理决策过程。其素质就是完成从面向营业过程数据的组织治理到面向营业阐发数据的组织和治理的改变过程,也是贸易智能BI中数据仓库的次要感化。

数据仓库 - 派可数据贸易智能BI可视化阐发平台

数据仓库就像企业的总的大仓库,可以存储差别来源、差别格局的数据,而且能够通过ETL和数据模子,对数据停止高量量的挑选,分级分类停止存储。具有很强的不变性,不会频繁的停止增删改等操做,可以反响汗青改变。

展开全文

用通俗的话来说就是数据仓库就像一个末端的大仓库,其他小仓库的各类货品会通过各类体例同一存储到那里,然后通过仓库位置的划分、货品的摆放停止回纳分类,实现标准、原则的从存放,到分类,再到利用的完全过程。

数据仓库中的数据治理

数据仓库中的数据治理以处理现实营业问题为导向,以提拔数据资产的治理程度和利用效率为目标,并以元数据为驱动,毗连数据原则治理、数据量量治理、数据平安治理各个阶段,构成同一、完美、笼盖数据全生命周期的数据治理系统。数据仓库中的数据治理次要针对以下问题。

第一,数据分离、杂乱,无法理解。良多企业营业线浩瀚,数据源分离,且各系统间无法打通,成为信息孤岛;数据搜集原则不不异,数据零星地存储在各个营业系统中,难以构成全局数据联动。

数据仓库- 派可数据贸易智能BI可视化阐发平台

第二,数据搜集渠道单一,形式落后,效率低,成本高。营业增长带来数据增长,传统数据治理形式难以应对大数据增长。从渠道上来说,传统数据搜集渠道单一、落后、偏线下化;从体例上来说,良多企业搜集信息的手段仍停留在手工搜集阶段,效率低、成本高且形成数据不婚配。

第三,数据原则不同一,欠缺阐发东西,数据难运用。一方面,数据原则不同一招致整合困难,难以停止全局联动;另一方面,欠缺数据阐发东西,仅靠数据专业人才难以称心企业需求,且难以看到数据的实时改变及价值。那两方面的因素招致难以实正实现数据驱动营业开展,提拔运营治理程度。

第四,系统落后,难以称心数据治理需求,存在数据风险隐患。在数据井喷式增长的当下,浩瀚企业未能跟上随数据增长而改变的需求,难以称心监管要求,同时存在数据隐患及风险问题

数据仓库建模体例

在Kimball和Inmon两位数据仓库范畴大佬差别标的目的的体味批示下,数据仓库的建模已经是一个成熟的系统,能够根据需求抉择差别的体例,既有三范式 3NF 建模,也有维度建模好比星型或雪花型的建模体例。

数据仓库- 派可数据贸易智能BI可视化阐发平台

数据仓库还有着分层构造,每个分层构造都有各自的感化,好比经常看到的ODS 层、Trans 层、Dimension 层、Data Mart 层等,都是为了将数据从大海中停止挑选,从分离到集中停止高度汇总,构成一个个的主题,为后续的前端数据可视化阐发供给数据的支持。

数据仓库为了营业阐发的目标,因而需要拉通各个营业系统数据库的数据,保留大量汗青数据,同时为了阐发效率的提拔改动了传统数据库的数据组织形式,例如操纵合适于阐发型模子的Kimball维度建模体例来组织底层数据架构。

数据仓库 - 派可数据贸易智能BI可视化阐发平台

数据仓库办事于贸易智能BI阐发,通过贸易智能BI前端可视化阐发东西来拜候,是此中不成或缺的一部门。而且在持久的建立中,贸易智能BI已经构成了一套间接零代码设置装备摆设并完成数仓建模的整个过程,停止了完全的产物化,处理了困难的架构与模子的问题。

数据仓库关于企业的价值

数据仓库能实现跨营业条线、跨系统的数据整合,为治理阐发和营业决策供给同一的数据撑持,从底子上把运营数据转化成为高价值的能够获取的信息(或常识),而且在安妥的时候通过安妥的体例把安妥的信息传递给安妥的人。

数据仓库定义:面向主题的(Subject Oriented)、集成的(Integrate)、相对不变的(Non-Volatile)、反映汗青改变(Time Variant)的数据聚集;

面向主题:是指用户利用数据仓库停止决策时所关心的重点方面,如:收进、客户、销售渠道等;所谓面向主题,是指数据仓库内的信息是按主题停止组织的,而不是像营业支持系统那样是根据营业功用停止组织的。

集成的:是指数据仓库中的信息不是从各个营业系统中简单抽取出来的,而是颠末一系列加工、整理和汇总的过程,因而数据仓库中的信息是关于整个企业的一致的全局信息。

治理驾驶舱 - 派可数据贸易智能BI可视化阐发平台

反映汗青改变:数据仓库内的信息其实不只是反映企业当前的形态,而是笔录了从过往某一时点到当前各个阶段的信息。通过那些信息,能够对企业的开展过程和将来趋向做出定量阐发和揣测。

0
回帖

聊聊数据仓库是什么 期待您的回复!

取消
载入表情清单……
载入颜色清单……
插入网络图片

取消确定

图片上传中
编辑器信息
提示信息