标签:拉链 解决方案 数据仓库 维度 缓慢 重写 变化 事实
目录
1-背景
众所周知,虽然维度表属性相对稳定,但是并不是一成不变的,尽管相当缓慢,维度值仍会随时间而变化。比如商品类目的改变,医院等级的改变。
在一些情况下,保留历史数据没有什么分析价值,而在另一些情况下,保留历史数据是非常重要的。
2-解决方案
2.1-重写维度值
在维度表中,仅需以当前值重写先前存在的值,不需要触碰事实表。
缺点:如果业务需要准确的跟踪历史变化,这种方案是没法实现的,并且在以后想改变是非常困难的。
修改后表数据:
2.2-插入新的维度行
插入新的维度行。采用此种方式,保留历史数据,
维度值变化前的事实和过去的维度值关联,维度值变化后的事实和当前的维度值关联。
缺点:虽然此方案能够区分历史情况,但是该方式不能将变化前后记录的事实归一为变化前的维度或者归一为变化后的维度
2.3-添加新的维度列
有些是只保留最新的维度值和最近的维度值,也有的是维度值一有变化就新增一个属性字段。都不是很好的解决方案
变化前:
变化后:
2.4-拉链表处理
这是精确跟踪缓慢变化维度属性的主要技术,因为新维度行能够自动划分事实表的历史,所以这是一项非常好的技术。
变化前:
变化后:
此处直接介绍缓慢变化维处理,拉链表在本篇文章中没有详细讲解,如想看请参考:
拉链表的详细实现过程
这篇文章,定会让你受益匪浅!!!!
标签:拉链,解决方案,数据仓库,维度,缓慢,重写,变化,事实 来源: https://blog.csdn.net/CLKTOY/article/details/120452956
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。