ICode9

精准搜索请尝试: 精确搜索
  • 数据仓库(9)数仓缓慢变化维度数据的处理2022-05-06 21:31:23

      数据仓库的重要特点之一是反映历史变化,所以如何处理维度的变化是维度设计的重要工作之一。缓慢变化维的提出是因为在现实世界中,维度的属性并不是静态的,它会随着时间的流逝发生缓慢的变化,与数据增长较为快速的事实表相比,维度变化相对缓慢。阴齿这个就叫做缓慢变化维。   这里

  • 零基础入行数据分析师,面试问题分享2022-05-01 18:31:05

    【什么是企业数据仓库?】 企业数据仓库是存储和管理企业所有历史业务数据的企业资料库。一个典型的企业数据仓库系统通常包含数据源、 数据存储与管理、OLAP服务器以及前端工具与应用四个部分。 企业数据库地数据通常来源于:数据通常来自于 ERP、CRM,物理记录或其他平面文件等。为未

  • 现代数据架构的核心特征:“1个中心+10个强化”2022-04-07 16:31:36

      每个为决策提供数据的组织都在重新思考其数据架构。与五年前相比,新技术加速改变组织竞争和服务客户的方式。现代数据驱动的组织不是事后对事件做出反应,而是预测业务需求和市场变化,并主动工作以优化结果。不创新或改造其数据架构的公司会失去客户、资金和市场,失去优势和竞争力

  • 数据湖概要分析2022-04-02 18:32:20

    一、什么是数据湖 数据湖是一种不断演进中、可扩展的大数据存储、处理、分析的基础设施;以数据为导向,实现任意来源、任意速度、任意规模、任意类型数据的全量获取、全量存储、多模式处理与全生命周期管理;并通过与各类外部异构数据源的交互集成,支持各类企业级应用。 用阿里的数据架

  • 2.3.12 hadoop体系之离线计算-Hive数据仓库-HIVE的严格模式2022-03-21 19:01:59

    目录 1.写在前面 2.参数设置 3.分别解释 1.写在前面         最近在写一个sql,碰见一个报错,内容如下: Error while compiling statement: FAILED: SemanticException Cartesian products are disabled for safety reasons. If you know what you are doing, please seth

  • 数据仓库—数据集成2022-03-21 18:36:24

    这几天上海疫情严重了,居家办公了几天,后面如果去公司上班需要核酸证明,今天去做了个核酸,竟然是桶鼻子,卧槽。不过说实话,捅鼻子也没啥,这酸爽犹如灵魂出窍,全身通透,让人飘飘然而不知所措。做一次管3天,后面可能还要去做,其实我在想传说中的肛拭子是啥样,我倒真希望体验一下。。。 数据仓库

  • 数据仓库建模(三):事实表的设计2022-03-20 17:00:35

    数据仓库建模(三):事实表的设计 事实表结构可加、半可加、不可加事实事实表中的空值一致性事实(事实表中字段命名尽量保持统一)事务事实、周期性快照事实表、累计快照事实表、无事实的事实表 事实表结构 事实表中每一行对应一个度量事件,反之亦然,比如订单表,每一行对应一个用

  • 数据库DB与数据仓库DW区别和联系2022-03-02 19:30:01

    数据库(DB)和数据仓库(DW)的区别与联系 数据库与数据仓库基础概念: 数据库:传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。 数据仓库:数据仓库系统的主要应用主要是OLAP(On-Line Analytical Processing),支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查

  • CDGA:应聘数仓岗,选择企业级别 or 算法团队?2022-03-02 09:58:48

    随着信息化、网络化、数字化成为社会发展的大趋势,信息化浪潮冲击着人类社会的各个领域。 衍生出了许多数据相关的岗位,如数据挖掘工程师、大数据开发工程师、数据安全研发工程师、数据产品经理、大数据分析师、大数据系统研发工程师、数据仓库工程师等。 其中数据仓库工程师是

  • 高级管理人员信息系统和数据仓库以及外部数据/非结构化数据与数据仓库2022-02-28 17:34:29

    内容目录 高级管理人员信息系统和数据仓库以及外部数据/非结构化数据与数据仓库一、高级管理人员信息系统和数据仓库二、外部数据/非结构化数据与数据仓库 高级管理人员信息系统和数据仓库以及外部数据/非结构化数据与数据仓库 一、高级管理人员信息系统和数据仓库 EIS

  • Hive-入门2022-02-25 22:35:55

    一、 数据仓库 1. 数据仓库的基本概念         简称DW,Data Houseware。专门存储数据,构建面向分析的集成化数据环境,主要职责是做数据分析以支持决策。 2.数据分析的特征:         面向主题:数据分析有一定的范围,需要选择一定的主题进行分析         集

  • 数仓建模—数据集市2022-02-23 22:02:55

    数据仓库系列文章(持续更新) 数仓架构发展史 数仓建模方法论 数仓建模分层理论 数仓建模—宽表的设计 数仓建模—指标体系 数据仓库之拉链表 数仓—数据集成 数仓—数据集市 数仓—商业智能系统 数仓—埋点设计与管理 数仓—ID Mapping 数仓—OneID 数仓—AARRR海盗模型 数仓—总

  • 数据仓库(4)基于维度建模的数仓KimBall架构2022-02-23 19:33:59

      基于维度建模的KimBall架构,将数据仓库划分为4个不同的部分。分别是操作型源系统、ETL系统、数据展现和商业智能应用,如下图。   操作型源系统,指的就是面向用户的各类系统,如app、网站、ERP、CRM等系统。这一块就是我们数据仓库的数据来源,并且这类数据往往有各自的格式和

  • 数仓建模—数据集成2022-02-22 22:33:13

    数据仓库系列文章(持续更新) 数仓架构发展史 数仓建模方法论 数仓建模分层理论 数仓建模—宽表的设计 数仓建模—指标体系 数据仓库之拉链表 数仓—数据集成 数仓—数据集市 数仓—商业智能系统 数仓—埋点设计与管理 数仓—ID Mapping 数仓—OneID 数仓—AARRR海盗模型 数仓—总

  • 10、Hive数据仓库——函数2022-02-22 18:58:50

    Hive数据仓库——函数 文章目录 Hive数据仓库——函数Hive 常用函数关系运算数值计算条件函数日期函数字符串函数 Hive 中的wordCountHive 开窗函数测试数据建表语句row_number:无并列排名dense_rank:有并列排名,并且依次递增rank:有并列排名,不依次递增percent_rank:(rank的结果

  • 电商数仓学习-数据仓库指标体系分析(12)2022-02-20 20:00:41

    数据仓库指标体系分析 前言 一、最近1/7/30日各渠道访客数 二、最近1/7/30日各渠道会话平均停留时长 三、最近1/7/30日各渠道总会话数 四、最近1/7/30日各渠道跳出率 五、最近1/7/30日页面浏览路径分析(各跳转次数) 六、流失用户数 七、流失用户数 八、用户新增留存率 九

  • 6、Hive数据仓库——Hive分桶2022-02-20 16:30:19

    文章目录 Hive分桶开启分桶开关建立分桶表往分桶表中插入数据 Hive分桶   分桶实际上是对文件(数据)的进一步切分,Hive默认关闭分桶。   作用:在往分桶表中插入数据的时候,会根据 clustered by 指定的字段 进行hash分区 对指定的buckets个数 进行取余,进而可以将数据分割

  • 你还不知道的数据仓库的两大作用,收藏起来老板都夸好!2022-02-18 17:01:49

    ​之前小编就有写过几篇数据仓库的文章,但是还会有些小伙伴还不能够清晰明白数据仓库的作用,那么这篇文章就重点介绍数据仓库的两大作用,还不赶紧收藏起来?     首先,我们还是要温习一下,数据仓库的概念是什么?   数据仓库是为企业各级决策过程,提供各类数据支持的战略集合。它是为分

  • 大数据技术【9】2022-02-09 14:05:14

    1.Apriori方法通常用于关联规则挖掘。。 2.数据仓库可支持决策。 3.用于分类的离散化方法之间的根本区别在于是否使用类信息。 4.大数据可视化可以用在以下何种场景()。 A.其余所有选项均可 B.电子地图 C.股票趋势 D.公司财务报表、销售统计 5.下面关于数据开放的陈述哪个是不正确

  • 数据仓库(2)数仓、大数据与传统数据库的区别2022-02-07 20:05:05

      文章来源:数据仓库(2)数仓、大数据与传统数据库的区别   数据仓库与大数据区别,数据仓库与数据库的区别,大数据与传统数据库的区别等等,这篇文章带你了解。   我们这里先来说说今天要对比的三个主体,数据仓库、大数据、数据库,在详细说明之前,我们先来说说这三个百度百科上面的定

  • 数据仓库(2)数仓、大数据与传统数据库的区别2022-02-07 19:32:50

      文章来源:数据仓库(2)数仓、大数据与传统数据库的区别   数据仓库与大数据区别,数据仓库与数据库的区别,大数据与传统数据库的区别等等,这篇文章带你了解。   我们这里先来说说今天要对比的三个主体,数据仓库、大数据、数据库,在详细说明之前,我们先来说说这三个百度百科上

  • HUE简介2022-02-05 01:01:58

    HUE 简介:HUE=Hadoop User Experience Hue是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,是基于Python Web框架Django实现的。 作用:通过使用Hue可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据,例

  • Spark已死?DBT会替代?2022-02-02 10:59:58

    数据世界再次发生变化。自从 Hadoop 出现以来,人们就将工作负载从他们的数据仓库转移到了新的闪亮的数据湖中。没过多久,2010 年开源的 Spark 就成为了数据湖上的标准处理引擎。 现在我们看到一个反向趋势,回到数据仓库。随着这一趋势,DBT 几乎已成为在现代云原生数据仓库上进行

  • 介绍Cirdan,嵌入式数据仓库2022-02-01 23:35:38

      Mark Papadakis.   9分钟阅读   Cirdan是一个嵌入的“数据仓库”。通过嵌入式,我的意思是它是可以与程序链接以使用它提供的功能的库,并且由“数据仓库”是指可以编程和/或通过使用SQL更新和访问的数据存储库。   考虑 BigQuery, SnowFlake, RedShift,除了云或多台机器上没

  • 数据仓库分层原理2022-02-01 11:02:00

    数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,用于对管理决策过程的支持。互联网时代,由于上网用户剧增,特别是移动互联网时代,海量的网络设备,导致了海量的数据产生,企业需要也希望从这些海量数据中挖掘有效信息,如行为日志数据,业务数据,爬虫数据

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有