标签:数据 系统 数据仓库 Hadoop 查询 集市 小结 ETL
数仓
- 数据仓库是一个面向主题的、集成的、随着时间变化的、非易失的数据集合,用于支持管理者的决策过程。
- 数据仓库中的力度是指数据的细节或汇总程度,细节程度越高,粒度几倍越低。
- 数据仓库的数据来自各个业务应用系统。
- 很多因素导致直接访问业务系统无法进行全局数据分析工作,这也是需要一个数据仓库的原因所在。
- 操作型系统是一类专门用于管理面向事务的应用信息系统,而分析型系统是一种快速回答多维分析查询的实现方式,两者在很多方面存在差异。
- 构成数据仓库系统的主要组成部分有数据源、ODS、中心数据仓库、分析查询引擎、ETL、元数据管理和自动化调度。
- 主要的数据仓库架构有独立数据集市、从属数据集市、Inmon 企业信息工厂、Kimball多维数据仓库、混合型数据仓库。
- ETL是建立数据仓库最重要的处理过程,也是最体现工作量的环节。
- Kettle是常用的开源ETL工具。
- 数据仓库的基本需求是安全性、可访问性、自动化,对数据的要求是准确性、时效性、历史可追溯性。
标签:数据,系统,数据仓库,Hadoop,查询,集市,小结,ETL 来源: https://www.cnblogs.com/astride/p/11190424.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。