大白话给你批注白数据仓库

3天前 (02-24 07:51)阅读1回复0
花花
花花
  • 管理员
  • 注册排名3
  • 经验值131510
  • 级别管理员
  • 主题26302
  • 回复0
楼主

数据仓库的素质就是完成从面向营业过程数据的组织治理到面向营业阐发数据的组织和治理的改变过程。

数据仓库类比粮食仓库

营业过程数据的组织治理现实上就是由各类营业系统来完成的,好比ERP、CRM、OA等各类营业系统,处理的是根本的营业流程治理。通过数据的录进 Insert、删除Delete、修改 Update、查询 Search ,即用户在营业系统操做界面中做的增删改查操做,那些操做和营业系统底层的数据库例如MySQL、Oracle、SQL Server 完成了数据的交互,数据也沉淀在那些数据库中。

数据仓库 - 派可数据贸易智能BI可视化阐发平台

各个营业系统的数据库比做是一个个粮食仓库的话,数据仓库就能够简单理解为,要把各个分离的粮食仓库的粮食移运到一个更大的粮食仓库来集中治理。

差别的独立的粮食仓库中存储的粮食可能纷歧样,有的粮食坏了可能不克不及食了,那么在汇总到大的粮食仓库过程中就需要把那些坏掉的粮食给往除掉。还有在差别的粮食仓库中可能也存了一些同样的粮食,那么在移运到大的粮食仓库中,就需要往做一些回类合并,根据更好的一种陈列体例将粮食摆放整洁,最初对外撑持的时候,就从那个大的粮食仓库间接取粮食就能够了。各类粮食都有,而且有很好的组织形式。

那个从小的粮食仓库移运、清洗转换、加载粮食的过程就是ETL过程,Extraction 抽取、Transformation 转换、Loading 加载。

数据仓库的素质仍是一个数据库,它将各个异构的数据源数据库的数据给同一治理起来,而且完成了量量较差的数据的剔除、格局转换,最末根据一种合理的建模体例来完成源数据组织形式的改变,以更好的撑持到前端的可视化阐发。

数据仓库 - 派可数据贸易智能BI可视化阐发平台

展开全文

在那个过程中,有的时候可能用通俗的汽车移运粮食,有的可能用飞机运粮食,有的可能需要每小时运一次,有的可能就需要天天运一次或者每月运一次,那就是ETL东西的抉择和数据抽取调度以及抽取频次的治理。有的时候粮食比力多,一般的粮食仓库容量不敷,或者要求效率更高,就会抉择差别的粮食仓库架构来停止治理,那就是数据仓库手艺框架的抉择,是抉择大数据手艺框架,仍是一般的手艺框架就能够称心,最末决定了我们要建立那个数据仓库的投进成本。

数据的维度和目标

维度就是看数据的角度,被看的数据就是目标。好比:我想看2020年北京地域某品牌电脑的销售量、销售额和毛利。那里面的2020年、北京地域、某品牌电脑就是维度,别离代表了年维度、区域维度和品牌维度,看的是什么数据呢?就是销售量、销售额和毛利,那三个数据就是被看的目标。

目标 - 派可数据贸易智能BI可视化阐发平台

如许的一个问题就简单构成了由年、区域、品牌三个维度以及销售量、销售额、毛利三个目标构成的一个简单的阐发模子。当然假设需要从其它维度来看那些目标,在构建那个阐发模子的时候就能够把那些阐发的角度都加进往,构成一个相比照较全面的阐发模子。

维度 - 派可数据贸易智能BI可视化阐发平台

在那个阐发模子中,维度能够肆意搭配组合,好比只想晓得2019年山东地域的销售量、销售额,现实上就只用到了那个阐发模子中的两个维度和两个目标,前台的阐发就会根据用户所抉择的维度和目标组合响应的 SQL 查询语句到后台数据仓库中查询,并将查询的成果返回到前端页面来衬着并闪现出最初所需要的成果。

SQL

那个 SQL 根本的格局就是 SELECT SUM

(销售量)、SUM(销售额)FROM 模子 GROUP BY 时间、区域,时间过滤前提就是2019年,区域过滤前提就是山东地域。

假设只想晓得2020年全年的销售量、销售额,仍是适才的哪个 SQL 语句,只不外在GROUP BY 的时候就只会 GROUP BY 时间那个维度,时间过滤前提就是 2020年。

SQL - 派可数据贸易智能BI可视化阐发平台

所以,阐发维度和阐发目标在那个模子中是能够乖巧的组织搭配,动态的组织SQL查询反查数据阐发模子,从数据阐发模子中提取查询成果返回到前端页面,那就是贸易智能 BI 阐发的根本原理。

0
回帖

大白话给你批注白数据仓库 期待您的回复!

取消
载入表情清单……
载入颜色清单……
插入网络图片

取消确定

图片上传中
编辑器信息
提示信息