ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

数据仓库之元数据

2021-09-07 13:32:19  阅读:89  来源: 互联网

标签:之元 管理 数据仓库 系统 用户 数据管理 数据


元数据及其管理

1、元数据的分类

元数据大致分为两类:
管理元数据和用户元数据

管理元数据主要为主要为负责开发、维护数据仓库的人员使用,是关于存储于数据仓库的技术细节的数据,用于开发和管理数据仓库的使用数据:

  1. 数据仓库的结构描述,包括仓库模式、视图、维、层次结构和导出数据的定义,以及数据集市的位置和内容。
  2. 业务系统,数据集市,数据仓库的体系结构和模式
  3. 汇总用的算法,度量和维定义的算法,数据粒度、主题领域、聚集、汇总、预定义的查询和报告
  4. 操作环境到数据仓库环境的映射,包括源数据和他们的内容数据分割、数据提取、清理、转换规则、数据刷新规则、安全(用户授权和存取的控制)

用户元数据提供了使用者和系统之间的语义层(让不懂得技术的人能够读懂数据仓库中的数据)通过用户元数据用户可以了解:

  1. 如何连接数据仓库
  2. 哪些部分可以访问
  3. 数据来源于哪一个源系统
2、元数据的作用

元数据主要作用:

  1. 元数据是进行数据集成所必需的
  2. 可以帮助最终用户理解数据仓库中的数据
  3. 元数据是保证数据质量的关键
  4. 可以支持需求的变化
3、元数据的管理
  1. 获取并存储元数据

数据仓库中的数据时间跨度比较长(5-10年),在这个期间系统可能会发生变化,对应的各种方法和算法以及本系统本身的结构和内容也会发生变化这就意味元数据管理必须提供按照合适版本来获取和存储元数据的方法能够让元数据可以随时间变化

  1. 元数据的集成

无论管理元数据和用户元数据,还是数据仓库系统模型的元数据和源系统模型的元数据,都必须以统一的方式集成(用户能够理解的),这也是元数据管理的难点

  1. 元数据的标准化

每一个工具都用自己专用的元数据,不同的工具在存储同一数据都必须用同一种方式表示,不同工具也应该可以自由/容易的交换元数据

  1. 保持元数据的同步

数据元素、数据结构、事件、规则的元数据必须在任何事件在整个数据仓库中保持同步如果数据或规则变化导致元数据发生变化,这个变化也要反映到数据仓库中
目前对于元数据的管理主要分为两种,对于简单的环境,就可以按照通用的元数据管理标准建立一个集中地元数据知识库;对于复杂的环境就可以分别建立个部分的元数据管理系统,形成分布式的元数据知识库。再通过建立标准的元数据交换格式实现元数据的集成管理。

标签:之元,管理,数据仓库,系统,用户,数据管理,数据
来源: https://blog.csdn.net/QQ__847812/article/details/120155544

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有