ICode9

精准搜索请尝试: 精确搜索
  • 03_50年数仓演化史2021-04-11 12:31:16

    文章目录 架构演化内驱业务数据库中间库数据仓库数仓与集市区别数据集市 架构演化内驱 系统架构是一个产品的基石,它的扎实是产品成长性的保障。但是架构永远与产品是共同成长的。新产品刚推出时,快速、可用即行,不可能构造一个复杂、庞大的基础架构。随着产品的热火,压力

  • 基于Hive进行数仓建设的资源元数据信息统计:Spark篇2021-04-09 20:01:22

    在数据仓库建设中,元数据管理是非常重要的环节之一。根据Kimball的数据仓库理论,可以将元数据分为这三类: 技术元数据,如表的存储结构结构、文件的路径业务元数据,如血缘关系、业务的归属过程元数据,如表每天的行数、占用HDFS空间、更新时间 而基于这3类元数据"搭建"起来的元数据系统,

  • 数栈数据中台专栏(一) :浅析数据中台策略与建设实践2021-04-07 17:05:00

    本文作者:张旭袋鼠云合伙人、技术总监、数据中台事业部副总经理,花名:老虎。在袋鼠云工作期间,深入了解客户需求,负责多个大数据项目的落地实施,如贵州茅台、新华书店、轻松筹、贵州交警等等,对于企业应用大数据的痛点具有清晰的了解和丰富的实践经验。 数据中台是什么? 数据中台建设的价

  • 在线教育大数据营销平台实战(一):大数据平台构建实战2021-04-03 14:01:33

    作者介绍Tigerhu在线教育公司大数据营销产品线负责人。本人目前在一家在线教育公司担任大数据营销产品负责人,由于一些机缘巧合,我同时负责了数据产品线和营销CRM产品线,因此给了我更多的机会去思考和实践如何把数据与营销业务深入融合,将大数据的势能赋予营销平台,从而实现业务的精细化

  • 在线教育大数据营销平台实战(一):大数据平台构建实战2021-04-03 14:01:11

    作者介绍Tigerhu在线教育公司大数据营销产品线负责人。本人目前在一家在线教育公司担任大数据营销产品负责人,由于一些机缘巧合,我同时负责了数据产品线和营销CRM产品线,因此给了我更多的机会去思考和实践如何把数据与营销业务深入融合,将大数据的势能赋予营销平台,从而实现业务的精细化

  • 进击的实时数仓:Flink在OPPO实时计算平台的研发与应用实践2021-03-31 11:01:35

    OPPO 大数据平台介绍首先介绍一下 OPPO 的业务跟数据规模。OPPO 是一家非常低调的公司,跟互联网、大数据到底有什么关系呢?简单地介绍一下。OPPO 有自己的基于安卓的定制系统 ColorOS,内置很多互联网应用,包括应用商店、浏览器、信息流等一些热门应用。这个系统经过几年的发展,日活现在

  • 阿里巴巴电商搜索推荐实时数仓演进之路2021-03-26 20:51:32

    分享嘉宾:张照亮 阿里巴巴 高级技术专家编辑整理:郑银秋出品平台:DataFunTalk导读:今天分享的内容是阿里搜索推荐数据平台研发团队在实时数仓的一些探索,围绕着团队在数仓上基于Flink + Hologres的演进过程及最佳实践。01业务背景阿里巴巴电商搜索推荐实时数据仓库承载了阿里巴巴集团淘

  • 阿里的数据仓库建模是否也是“华而不实”2021-03-25 22:59:28

    文章来源:彭文华 前言 这两天在脉脉上有一个帖子很火,主题居然是讨论数据建模的,太令我诧异了!这个时候脉脉上不应该都是在炫耀年终奖和新Offer么? 这个帖子是一位百度的同学在吐槽,为啥阿里的《大数据之路》讲的好像很牛,但是为什么跟我们实际工作中的情况不一样啊? “你们数据建

  • 数仓的基本概念和hive的配置准备2021-03-23 22:31:16

    数据仓库概述 数据仓库:简称DW data warehouse 里面装的都是数据 目的:构建面向分析的集成化数据环境,主要职责是做分析,对仓库里面的数据来做分析 数据分析可以支持我们做决策等 数据分析的特征: 面向主题:数据分析有一定的范围,需要选取一定的主题进行分析 集成性:集成各个其他方面

  • 如何搭建一个数据仓库2021-03-18 22:07:29

    有朋友私信我,说希望了解数仓的整体建设中的细节及模板。那有啥说的,上干货!数仓全景图镇楼 00建设过程数仓建模的过程分为业务建模、领域建模、逻辑建模和物理建模,但是这  些步骤比较抽象。为了便于落地,我根据自己的经验,总结出上面的七个步骤:梳理业务流程、垂直切分、指标体系梳理

  • 从入门到放弃,50G编程视频免费送!2021-03-18 22:04:08

    前端Git课程详细目录 01.前端版本控制器Git_基本概念 02.前端版本控制器Git_简介&安装 03.前端版本控制器Git_Linux基本命令 04.前端版本控制器Git_git对象 05.前端版本控制器Git_树对象 06.前端版本控制器Git_提交对象 07.前端版本控制器Git_高层命令1(基础) 08.前端版本控制器Git_

  • 浪尖聊聊大数据从业者的迷茫及解决方案2021-03-15 07:02:07

    浪尖聊聊大数据从业者的迷茫及解决方案 浪尖 浪尖聊大数据 最近不少粉丝找浪尖私聊,说做大数据久了比较迷茫,今天浪尖抽时间写篇文章聊聊做大数据迷茫了怎么办! 一 现状 目前的迷茫最主要原因是行业趋势所致,了解一下大数据行业的现状:对于整个行业来说处于上升期的小平台期。这么说

  • 数仓参考文章2021-03-08 13:31:23

    1、数据仓库的源数据类型 http://webdataanalysis.net/web-data-warehouse/data-warehouse-source-data/ http://webdataanalysis.net/web-data-warehouse/multidimensional-data-model/ 2、大数据下的数据分析平台架构 http://www.programmer.com.cn/7617/ 3、数据的游戏:冰

  • 传统数仓如何转型大数据2021-03-05 17:03:44

    转: 传统数仓如何转型大数据 大家好,我是一哥,前几天建了一个数据仓库方向的小群,收集了大家的一些问题,其中有个问题,一哥很想去谈一谈——现在做传统数仓,如何快速转到大数据数据呢?其实一哥知道的很多同事都是从传统数据仓库转到大数据的,今天就结合身边的同事经历来一起分享一下。 一、

  • day21笔记(知行教育结构说明+数据仓库概念+维度、指标概念)2021-02-28 22:33:13

    1、项目背景 1、近年来,在线教育产业发展十分迅速。尤其是2018年以来,在线教育平台动作不断,除了洋葱数学、考虫、作业盒子、火花思维、VIPKID、阿卡索等平台纷纷融资外,诸多在线教育平台纷纷上市。新东方在线也在2019年3月成功上市。 在市场规模方面,在线教育很大程度上是随着移

  • 实时数仓(四):Canal客户端开发代码编写2021-02-26 16:01:25

    大家好,欢迎来到本篇博客,利用空闲的时间来分享自己所学的知识,帮助和博主一样刚处于起步阶段的同学,水平不高,若有什么错误和纰漏之处恳请大佬不吝赐教,目前个人博客只有CSDN:https://zhenyu.blog.csdn.net/,感谢大家的支持,谢谢 送给大家一句话:今日事,今日毕 今日目标:

  • 数仓项目2021-02-19 11:02:57

    背景:客户行为数据越积越多,公司有着挖掘客户大数据分析的需求 方案: 通过大数据仓库离线分析+presto引擎工具实现 用到的组件:hadoop2.7.4   、  hive-1.2.1(不要用2.X版本,坑很多)  、  sqoop-1.4.6 、  presto-server 运作流程: 1、sqoop将关系型数据库mysql的数据以分桶文

  • 数据仓库系列(四)数仓架构以及多维数据模型的设计2021-02-16 20:01:57

    文章目录 一、前言二、数据仓库的定义三、数据仓库的特点四、数据仓库的作用五、数据仓库的架构六、数据仓库的要求七 、数据仓库分层八、数据仓库四个层次的划分 8.1 ODS层8.2 PDW层8.3 APP层 九、数据流向十、数据仓库模型设计基础 10.1 维度数据模型10.2 维度数据

  • 数仓结构及设计2021-02-15 17:01:54

    4.1 数据仓库的定义 数据仓库数据的4个基本特征  数据仓库的数据是面向主题的  数据仓库的数据是集成的  数据仓库的数据是不可更新的  数据仓库的数据是随时间不断变化的   数据仓库的数据是面向主题的 1.主题 是一个抽象的概念,是在较高层次上将企业信息系统中的数据综合、归类

  • 【Sqoop】将mysq的数据导入hive数仓报错2021-02-14 19:31:59

    错误操作 bin/sqoop import \ --connect jdbc:mysql://ip:3306/demo \ --username 账号 \ --password 密码 \ --table order \ --num-mappers 1 \ --hive-import \ --fields-terminated-by "\t" \ --hive-overwrite \ --hive-table ods_order 错误详情 The connectio

  • Hive数仓构建及数据倾斜2021-02-13 22:03:50

    Hive数仓构建及数据倾斜   #数据倾斜 1 “英文名称为Data Warehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。它出于分析性报告和决策支持目的而创建。”     01 — 数据仓库   1.1、什么是数据仓库    

  • 咖啡汪日志——遇见数仓,理想与现实的碰撞,前景与难点的对接2021-02-10 13:01:41

    嗷呜! 作为不是在戏精,就是在戏精的路上的二哈 本汪最近又搞到了新玩意儿 做数仓,主要用于支撑大数据分析和架构层决策 前言 通过这篇文章,我们能学到什么: 1、了解数仓的前景。 2、了解到数仓前期ETL 所面临的问题。 3、了解到当下市面上常见的金融管理软件,用友、金蝶等进行移库

  • 数仓建模综述2021-02-07 12:03:44

    一、为什么需要建模 性能:良好的数据模型能帮助我们快速查询所需要的数据,减少数据I/O的吞吐。成本:良好的数据模型能极大地减少不必要的数据冗余,也能实现计算结果 复用,极大地降低大数据系统中的存储和计算成本。效率:良好的数据模型能极大的改善用户使用数据的体验,提高使用数据的效

  • 基于 Flink 的实时数仓生产实践2021-02-07 08:52:33

    基于 Flink 的实时数仓生产实践 Flink 社区 Flink 中文社区 数据仓库的建设是“数据智能”必不可少的一环,也是大规模数据应用中必然面临的挑战。在智能商业中,数据的结果代表了用户反馈、获取数据的及时性尤为重要。快速获取数据反馈能够帮助公司更快地做出决策,更好地进行产品迭代

  • 实时数仓项目-1.概述及数据采集2021-02-05 18:58:53

    文章目录 第1章 实时需求概览1.1 实时需求与离线需求的比较1.2 数仓架构设计1.2.1 离线image-202101201154530071.2.2 实时 1.3 本项目主要需求1.3.1 当日用户首次登录(日活)分时趋势图,昨日对比1.3.2 当日新增付费用户(首单)分析(ods+dwd)1.3.3 订单明细实付金额分摊以及交易

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有