ICode9

精准搜索请尝试: 精确搜索
  • 一文读懂数据仓库2021-10-14 09:33:13

    数据仓库 数据仓库(Data Warehouse DW)是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的大型数据库,它的数据基于事务型的关系数据库。 数据仓库中的数据是相对稳定的、集成的、面向主题的、反映历史变化的,以分析需求为目的数据集合。 数据集市 数据集市是

  • 数据库 与 数据仓库的本质区别是什么?2021-10-14 08:31:55

    作者:陈诚链接:https://www.zhihu.com/question/20623931/answer/139842331来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 数据库:传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。 数据仓库:数据仓库系统的主要应用主要是OL

  • 数据仓库_数据建模_指标体系2021-10-13 18:01:22

    目录 0 文章说明 1 概念 0 文章说明         文章内容主要来自网络,加上自己的修改,无法找到来源,如有侵权请告知. 1 概念 (1) 业务板块:比数据域更高维度的业务划分方法,适用于庞大的业务系统. (2) 维度:维度模型主张从分析决策的需求出发构建模型,为分析需求服务.维

  • ETL讲解(很详细!!!)2021-10-12 00:00:43

    ETL讲解(很详细!!!) ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 ETL是BI项目重要的一个环节。 通常情况下,在BI项目中ETL会花掉整个项目至少1/3的时间,ETL设计的好坏直接

  • 数据仓库介绍与实时数仓案例--阿里2021-10-08 23:34:25

    1.数据仓库简介 数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。 数据仓库是伴随着企业信息化发展起来的,在企业信息化的过程中,随着信息化工具的升级和新工具的应用,数据量变的越来越大

  • 【大数据】OLTP和OLAP,数据库和数据仓库2021-10-05 16:33:54

    在接触大数据之前我们基本都是使用mysql数据库,这种定位为关系型的数据库主要是为了实时业务需要而建表,而在大数据中大多是以分析为主的,读多写少,且如果用传统的关系型数据库则经常会涉及到多表联合查询,因此这种关系型数据库并不适用于分析场景,本文主要是介绍OLAP和OLTP区别以

  • 第7章Hadoop的数据仓库框架-Hive2021-10-04 23:01:20

            目录 7.1Hive的配置与安装 7.1.1安装MySQL         (1)安装MySQL       (2)配置Mysql          7.1.2安装和配置Hive          (1)安装hive         (2)配置环境变量         (3)配置hive         (4)上传jar包         (5)启动hive  7.1.3远

  • Hive中的ODS、 DWD、 DWS、 ADS 数仓分层2021-09-29 18:02:13

    1、数据仓库   我们常提的数仓(DataWarehouse),就是在我们已有的数据库(他是对数据的存储)的基础之上,增加了对数据的OLAP(On-Line Analytical Processing),支持复杂的数据分析操作,更侧重决策支持,提供直观易懂的查询结果,而数据库更着重的是事务处理。换句话讲,就是在数据库已经大量存在的

  • 初识Hive(数据仓库工具)2021-09-27 19:35:39

    一、Hive简介   hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。   hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供SQL查询功能,能将SQL语句转变成MapReduce任务来执行。  

  • 【墨天轮专访第五期】偶数科技常雷:创新改变世界,深耕云数据仓库2021-09-26 13:34:12

    导读 随着互联网的快速发展,数据库、中间件和操作系统已经并列成为了全球三大基础软件技术。而随着5G时代的来临,各行各业对于数据库的依赖程度和重视程度也在逐步提高。由于国内在数据库行业的发展起步较晚,数据库的市场份额长期被Oracle,微软等美国公司所控制,近两年从国际形势来看,

  • 数据仓库:SQL编码原则2021-09-24 15:05:41

    在数据仓库SQL语句的编写过程中,需要遵循一些SQL语句编写的原则,这样做的好处有以下几点: 增加SQL语句的可读性; 方便日后的数据校验排查; 提升SQL语句的性能; 提高SQL代码的复用性和扩展性; 减少SQL语句发生异常。 下面详细列出SQL语句中需要遵循的编码原则: 禁止使用select * 操作,所

  • 数据仓库之缓慢变化维解决方案2021-09-24 14:02:10

    目录 1-背景2-解决方案2.1-重写维度值2.2-插入新的维度行2.3-添加新的维度列2.4-拉链表处理 1-背景 众所周知,虽然维度表属性相对稳定,但是并不是一成不变的,尽管相当缓慢,维度值仍会随时间而变化。比如商品类目的改变,医院等级的改变。 在一些情况下,保留历史数据没有什么分析

  • 如何构建数据仓库分层2021-09-15 16:33:20

    ODS层-->DM层-->DWD层 第一步:   先构建ods_delta表(分区:日期,小时,分钟),开始源源不断写入ods_delta表中,只存储增量数据。   ods_delta表需要在原表基础上新增如下字段:       cdc_record_id STRING COMMENT '唯一自增序列号',       cdc_operation STRING COMMENT '

  • 大数据概述012021-09-09 15:01:36

     1.为什么产生大数据技术?         大数据就是曾经被称为数据仓库的逻辑延伸。顾名思义,大数据就是一个大型的数据仓库,一般有一个能支持业务决策的业务重点。如果是链接到客户的所有记录呢?将这么多不同的数据源互相映射,一般的数据库还做不到。另外,需要链接的数据量是非常巨大

  • 数据仓库之元数据2021-09-07 13:32:19

    元数据及其管理 1、元数据的分类 元数据大致分为两类: 管理元数据和用户元数据 管理元数据主要为主要为负责开发、维护数据仓库的人员使用,是关于存储于数据仓库的技术细节的数据,用于开发和管理数据仓库的使用数据: 数据仓库的结构描述,包括仓库模式、视图、维、层次结构和导出数

  • 数据仓2021-09-06 19:33:40

    一、用户行为数据采集 1.数据仓库概念    日志采集系统:用户搜索等行为等数据,做推荐系统等;存在文件,数据量超大; 业务系统数据库:数据库; 爬虫系统等:爬虫; 2.项目需求集架构设计 项目需求:1.数据采集平台搭建;2.实现用户行为数据仓的分层搭建;3.实现业务数据仓库的分层搭建;4.针对数据仓

  • 01-什么是数据中台2021-09-06 17:00:15

    01-什么是数据中台 大数据的本质是数据的融合,把原来各自孤立的各个系统的数据进行融合、拉通,从而对海量数据进行采集、存储、计算、加工和融合。并且通过对已有的数据分析历史和预测未来。“一切业务数据化,一切数据业务化”,IT时代不断通过各种信息化系统把业务以数据的形式沉

  • 重磅发布|新一代云原生数据仓库AnalyticDB「SQL智能诊断」功能详解2021-09-06 12:59:41

    SQL是一种简单易用的业务逻辑表达语言,但随着扫描数据量和查询复杂度的增加,查询性能会变得越来越慢。想要对SQL进行调优,往往需要关注以下几个部分: 需要了解引擎架构:用户往往需要对SQL引擎的架构特点有一定的了解,才能和业务的数据分布特征以及业务场景特征完美结合,来进行数据建模,

  • OLAP与OLTP区别2021-09-01 13:34:59

    1、数据库与数据仓库 数据库与数据仓库的区别就是OLTP与OLAP的区别 2、OLTP与OLAP OLTP:联机事务处理。增删改操作很多,也称面向交易的处理系统。对数据的增删改,频繁。 OLAP:联机分析处理。一般针对主题的历史数据进行分析、支持管理决策。 3、OLTP与OLAP区别图          

  • 数据湖和数据仓库的区别?2021-08-25 19:02:47

    进行数据分析工作的时候会用到很多的工具,比如说数据湖和数据仓库,不过这两者之间的差异和区别,可能会让人困惑。那么大家知道不知道数据湖和数据仓库的区别是什么呢?下面我们就给大家介绍一下数据湖和数据库的相关知识。 2010年,James Dixon提出数据湖(Data Lake)的概念。 2011年Dan Wo

  • 数据仓库面试题2021-08-21 14:02:19

    离线数仓面试题?1、ODS:存放原始数据,直接加载原始日志,数据,数据保持原貌不做处理。2、DWS:结构和粒度与原始表保持一致,对ODS层数据进行清洗(去除空值,脏数据)3、DWS:以DWD层为基础,进行轻度汇总。4、ADS:为各种统计报表提供数据。为什么要对数仓进行分层?1、把简单问题复杂化将一个复杂的任

  • 数仓面试题22021-08-21 14:01:53

    数仓与关系型数据库的区别?1、数据库有相对复杂的表格结构,存储结构相对紧致而数据仓库则是相对简单的表格结构,存储结构相对松散2、数据库在读和写两方面都有优化,数据仓库一般只是读优化3、数据库单次操作作用于少量数据,数据仓库单次操作作用与大量的数据4、数据库支持单条数据的修

  • 大数据开发技术之Hive数据仓库架构分层2021-08-20 10:02:10

    数据仓库架构分层 1. 数据仓库架构 数据仓库标准上可以分为四层:ODS(临时存储层)、PDW(数据仓库层)、DM(数据集市层)、APP(应用层)。 1)ODS层: 为临时存储层,是接口数据的临时存储区域,为后一步的数据处理做准备。一般来说ODS层的数据和源系统的数据是同构的,主要目的是简化后续数据加工处理的

  • 一、数据仓库2021-08-17 14:01:37

    什么是数据仓库          什么是数据库?     1.数据库(Database)是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库     2.数据库是长期储存在计算机内、有组织的、可共享的数据集合。数据库中的数据指的是以一定    的数据模型组织、描述和

  • 数据仓库建设的理解2021-07-29 15:33:19

    一、什么是数据仓库 数据仓库,最早由比尔·恩门(Bill Inmon)于1990年提出,主要功能是将组织或企业里面的联机事务处理(OLTP)所累积的大量数据,透过数据仓库理论所特有的储存架构,进行系统的分析整理,以利于各种分析方法如联机分析处理(OLAP)、数据挖掘(Data Mining)的进行,并进而支持

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有