ICode9

精准搜索请尝试: 精确搜索
  • 《阿里巴巴大数据实践-大数据之路》读后感言2022-01-28 16:58:01

    ​ 整个体系架构图,后面如有看不懂本书的可以回头再看下此图: 本书大概分为四篇来讲诉: 第一篇 数据技术篇 1、日志采集 阿里巴巴的日志采集体系方案包括两大体系: Apl us.JS 是 Web 端(基于浏览器)日志采集技术方案: UserTrack 是APP 端(无线客户端)日志采集技术方案。 2、数据同步

  • 数据仓库(二)——业务数据采集平台2022-01-25 09:33:25

    第一章 电商业务简介 1.1 电商业务流程        电商的业务流程可以以一个普通用户的浏览足迹为例进行说明,用户点开电商首页开始浏览,可能会通过分类查询也可能通过全文搜索寻找自己中意的商品,这些商品无疑都是存储在后台的管理系统中的。       当用户寻找到自己中意的

  • 数据中台还不清楚?看完Smartbi的这篇介绍你就懂了2022-01-21 10:32:41

    ​关于数据中台,可能大家都有听到过,但是它到底是什么意思?可能很多人都比较迷糊,今天小编就来一一解答究竟什么是数据中台? 数据中台是指通过数据技术,收集、计算、存储、加工大量数据,同时统一标准和口径。统一数据后,数据中心将形成标准数据,然后存储,形成大数据生产层,为客户提供高

  • 【转】关于数据建模之思考(三):数仓分层设计架构2022-01-19 17:32:03

    帆软有篇关于数仓建模的博文讲的不错,清楚解释了不同层次的作用和含义。   虚线下面是文章内容   文章出处https://www.fanruan.com/bw/gysjj   ---------------------------------------------------------------------------------------------------------------------    

  • 前方高能 | 如何优化企业“数据消费“策略2022-01-19 12:33:12

    随着大数据时代的到来,企业的数据消费模式发生转变并不断升级。企业正在清晰地认识大数据的价值并加以利用,通过数据分析找出并满足消费者的需求,在这场数字变革中实现转型。因此,本文主要讨论了在大数据时代下的企业数据消费层面的场景和面临的问题以及企业如何运用大数据技术来

  • 数据分层----ODS,DWD,DWS,ADS,DIM2022-01-19 12:00:02

    数据分层相关概念: 零、数据加载层:ETL(Extract-Transform-Load) 一、数据仓库层:DW(Data Warehouse) 操作数据层:ODS(Operational Data Store)数据明细层:DWD(Data Warehouse Detail)数据汇总层:DWS(Data WareHouse Summary)应用数据层:ADS(Application Data Store)通用维度层:DIM(Dimension) 推

  • 数据湖与数仓技术优势对比2022-01-16 16:34:22

      第一个维度是方法论,数据湖其实是一个文件存储系统,用户可以往里面放任何一种文件或者数据,它的一个典型特点是事后建模,它的方法论是用户先把数据放上来,然后再考虑如何使用,也叫做SchemaOnRead。数据仓库正好相反,它是事前建模的模式,当你在把数据推进数据仓库的时候,要求先CreateTab

  • OLTP与OLAP的区别2022-01-11 15:00:08

    OLTP和OLAP的区别 联机事务处理OLTP(on-line transaction processing) 主要是执行基本日常的事务处理,比如数据库记录的增删查改。比如在银行的一笔交易记录,就是一个典型的事务。 OLTP的特点一般有: 1.实时性要求高。我记得之前上大学的时候,银行异地汇款,要隔天才能到账,而现在是分分

  • 数据仓库2022-01-08 19:35:17

    第一章 数据仓库概念 数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。数据仓库本身并不“生产”任何数据,其数据来源于不同外部系统;同时数据仓库自身也不需要“

  • 大数据面试题——数据仓库2022-01-07 21:58:20

    文章目录 数据仓库 什么是数据仓库? 数据库与数据仓库的区别? 事实表和维度表 数据仓库的数据模型: 为什么数据仓库要分层? 数据仓库模式:Kimball (金箔)和 Inmon(恩门) 数据库架构——Lambda架构和Kappa架构 数据仓库五步法的流程 ETL、ELT 数据仓库 什么是数据仓库? 数据仓

  • 数仓_介绍2022-01-07 19:02:13

    数据仓库全称为Data Warehouse,简称DW 数据仓库是一种理论知识,通过数仓理论知识结合不同的业务体系而构建的数据生命体系,数据生命体系构建于整个数据平台体系之上业务体系之下。 数据仓库之父 Bill Inmon将数据仓库定义为——面向主题的、集成的、相对稳定的、反映历史变化的数据

  • 浪潮商用机器携手长亮科技和南大通用 打造基于GBase国产高端数据仓库方案2022-01-04 14:35:44

    日前,长亮科技数据仓库解决方案与浪潮K1 Power国产高端服务器基于国产化数据库南大通用GBase 8a,通过24项基础功能测试和业务场景性能测试,完美兼容且性能强劲,可实现顺利部署、平稳运行及高效服务。本次互认证对数据仓库建设从硬件、软件到实施的全面国产化之路具有重要参考意义。

  • 【数据仓库】【第四章】电商业务介绍2022-01-03 17:03:57

    业务数据 1.电商业务简介1.1 电商业务流程(用户购物流程)(1)检索物品(2)商品曝光(3)商品详情页面(4)加购(5)结算 1.2 电商常识1.2.1 SKU和SPU1.2.2 平台属性和销售属性 1.电商业务简介 1.1 电商业务流程(用户购物流程) (1)检索物品 来到电商首页,要检索想要的东西,有两种检索方式: 分类检

  • 数据仓库之DWD层2022-01-02 23:31:10

    DWD(Data WareHouse Detail)数据明细层,主要是将从业务数据库中同步过来的ODS层数据进行清洗和整合成相应的事实表。事实表作为数据仓库维度建模的核心,需要紧紧围绕着业务过程来设计。在拿到业务系统的表结构后,进行大概的梳理,再与业务方沟通整个业务过程的流转过程,对业务的整个生命

  • 数据中台/数据仓库2021-12-30 19:06:06

      目前架构: TIDB+fineBI  (很好的平衡了OLTP和OLAP的数据处理需求) 1.TiDB属于对于实时数据分析的支持做的特别好,支持水平扩展与高可用,内部集成spark作为计算引擎, 2. fineBI可以拖拖拽拽就可以快速实现数据的组合和导出,丰富的报表展现形式,细致的权限控制, 建议:fineBI只作为一个展

  • 大数据技术原理与应用 第三版 林子雨 期末复习(四) Hive2021-12-24 22:30:25

    大数据技术原理与应用 第三版 林子雨 期末复习(四) Hive 概念数据仓库层次传统数据仓库面临的挑战Hive简介Hive与传统数据库对比 概念 Hive是一个基于Hadoop的数据仓库工具。数据仓库指的是一个面向主题的、继承的、相对稳定的、反应历史变化的数据集合,用于支撑管理决策。

  • hadoop与hive2021-12-17 16:30:34

    数据依然是存储在HDFS中,由HDFS负责管理数据冗余与一致性。Hive只是在此基础上构建了一个表,在进行数据查询时,Hive引擎将SQL语句转化为下层的mr作业,然后在mr的基础上进行计算,计算完成,最后返回结果。 Hive的语法从MySQL中借鉴了很多东西,因此很多MySQL语句可以直接在Hive中使用。但M

  • 数据仓库各层到底在做什么?(ODS,DWD,DWM,DWS,ADS)2021-12-16 16:01:24

    文章目录 源数据层(ODS)数据仓库层(DW)DWD明细层DWM 中间层DWS 业务层 数据应用层(ADS或DA或APP)维表层(DIM) 源数据层(ODS) 此层数据无任何更改,直接沿用外围系统数据结构和数据,不对外开放;为临时存储层,是接口数据的临时存储区域,为后一步的数据处理做准备。 (不需要修改的数据) 数

  • 一般数据库增量数据处理和数据仓库增量数据处理的几种策略2021-12-16 10:01:09

    开篇介绍 通常在数据量较少的情况下,我们从一个数据源将全部数据加载到目标数据库的时候可以采取的策略可以是:先将目标数据库的数据全部清空掉,然后全部重新从数据源加载进来。这是一个最简单并且最直观的并且不容易出错的一种解决方案,但是在很多时候会带来性能上的问题。 如果我们

  • (原创)大数据 数仓基本概念梳理2021-12-15 20:33:03

      一、大数据的基本概念   其实到目前为止对于大数据的数据量的多少还是一个可变定义,主观定义,即并不是要大于一个特定数据的TB,才叫大数据,包括在做的项目中,有的客户因场景需求即使几TB的数据仍然需要建立大数据体系来提供价值。所以这就体现了数据的属性,如行业属性,历史属性,价值

  • Hadoop大数据之真实电商数据仓库全流程开发详解2021-12-15 18:34:03

    课程目录 1.P1_-_A1_-_互联网电商大数据环境_-_1 2.P1_-_A1_-_互联网电商大数据环境_-_2 3.P1_-_A2_-_商业智能与数据仓库基础理论_-_1_-_BI的作用 4.P1_-_A2_-_商业智能与数据仓库基础理论_-_2_-_BI的构建 5.P1_-_A2_-_商业智能与数据仓库基础理论_-_3_-_数据仓库理论 6.P1_-_A

  • 大数据方向职业选择与规划2021-12-12 13:04:06

            本人在大数据领域工作多年,工作经历主要涉及数据仓库、大数据平台研发,目前在互联网行业前Top2大厂任职,对大数据领域有相对丰富的认知和理解,做一些行业入门分享和职业规划给初入行者或者正在迷茫期的同行。 大数据是什么         随着21世纪互联网的普及和发展,现

  • 八、数据仓库电商项目——可视化报表Superset2021-12-11 18:34:08

    第 第 1 章 章 Superset 入门 1.1 Superset  概述 Apache Superset 是一个开源的、现代的、轻量级 BI 分析工具,能够对接多种数据源、 拥有丰富的图标展示形式、支持自定义仪表盘,且拥有友好的用户界面,十分易用。 1.2 Superset  应用场景 由于 Superset 能够对接常用的大数据分

  • 大数据之数据仓库Data Warehouse总结2021-12-11 14:30:57

    数据仓库Data Warehouse 数据处理方式 OLTP 全称是On-line Transaction Processing 联机事务处理专注于事务,crud操作 OLAP 称是 On-line Analytical Processing 中文名称是联机分析处理 专注查询和分析 OLAP基本操作 上卷:roll-up drill-up 通过一个维的概念分层向上攀

  • 数据仓库知识储备2021-12-09 22:06:16

    数据仓库知识储备 1.数据仓库定义2.数据库和数据仓库的区别3.数据库的三范式4.数据仓库的特点5.数据仓库的分层6.数据库事务及其特性 1.数据仓库定义 首先,用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库其次,对多个异构的数据源有效集成,集成后按照主题

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有