ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

20190523 对数据仓库的一些思考

2019-05-23 09:53:17  阅读:208  来源: 互联网

标签:数仓 同步 加工 数据 数据仓库 业务 思考 20190523


数据仓库  跟 数据集市的区别 ?

如果构建一个数据仓库?

目前外包公司对很多客户公司其实构建的数据仓库多不符合数据仓库模型

那么这个“外包”数据仓库从何而来,就按一个部门来看,针对的是该部门需要的数据,原来的业务分析都是基于Excel的,所以很多数据根据业务相关的Excel去得到(这应是繁琐又最简单的数据来源了)

这些数据没有进过加工,也就是没有业务部门人员的公式运算,但在数仓里面这个就变成了计算加工得到结果集

外包公司大多没有对数据仓库构建的建模概念想法,一般是业务想要什么数据,就做什么表结构,唯一就是说数据的同步方面有一定的方式,有人问了我关于实时业务数据库跟数据仓库之间的数据同步问题,因为很多业务数据库创建的人没有思考过时间戳的问题导致很多数据源头到数仓都数据同步、处理就会有问题,导致同步的不容易

 

然而我觉得有个问题,当数据同步到数仓中后,逻辑加工,滚数,一旦中间数据有一点问题,很难发现

哪怕数据同步到数仓后时漏数,一样发现会很晚,预警机制不够,数据透明检测也是一个弊端

后期会出现,大量的修数,重加工动作

 

标签:数仓,同步,加工,数据,数据仓库,业务,思考,20190523
来源: https://www.cnblogs.com/Soar-Pang/p/10910129.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有