ICode9

精准搜索请尝试: 精确搜索
  • 数据仓库之数据分析2019-10-03 09:02:57

    1. 数据仓库基本介绍   英文名称为Data Warehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。它出于分析性报告和决策支持目的而创建。   数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据

  • 项目管理,REID,矩阵,终端,镜像,Voip,AVB,串口,串口服务器,数据库,数据仓库,码流,心跳包,名词解释2019-10-01 19:03:08

    项目管理,REID,矩阵,终端,镜像,Voip,AVB,串口,串口服务器,数据库,数据仓库,码流,心跳包,名词解释   项目管理: 项目管理是管理学的一个分支学科 ,对项目管理的定义是:指在项目活动中运用专门的知识、技能、工具和方法,使项目能够在有限资源限定条件下,实现或超过设定的需求和期望的过程。项目管理

  • 学习_011_Hive在大数据分析和大数据仓库中应用实战&玩转大数据之Hive应用实战2019-09-22 13:36:28

    课程说明 项 内容 课程类型 视屏教程 内容类型 Hive 课程名称 Hive在大数据分析和大数据仓库中应用实战 / 玩转大数据之Hive应用实战 地址 https://edu.csdn.net/course/detail/25043 / https://edu.csdn.net/course/detail/8350 分钟 900 + 600 费用 199

  • 企业级数据仓库:数据仓库概述;核心技术框架,数仓理论,数据通道Hive技术框架,HBase设计,系统调度,关系模式范式,ER图,维度建模,星型/雪花/星座模式,数据采集同步,业务数据埋点,数据仓库规范2019-09-20 18:03:48

    文章目录 第一章 数据仓库概述 1.1 数据仓库简介 1.1.2 什么是数据仓库? 1.1.3 OLTP 与 OLAP 1.2 数据仓库技术架构 1.3 课程目标 第二章 核心技术框架 2.1 数据仓库周边技术框架 2.1.2 数据采集 Datax Sqoop Datax 与 Sqoop 的对比 数据采集框架综述 2.1.3 数据通道 Kaf

  • 数据仓库数据模型之:极限存储–历史拉链表2019-09-20 15:05:43

    原文链接:http://lxw1234.com/archives/2015/04/20.htm 在数据仓库的数据模型设计过程中,经常会遇到这样的需求: 数据量比较大; 2. 表中的部分字段会被update,如用户的地址,产品的描述信息,订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信

  • 版本控制系统2019-09-16 17:55:39

    常见版本管理工具: SVN   集中式的版本控制系统,只有一个中央数据仓库,  如果中央数据仓库挂了或者不可访问,所有的使  用者无法使用SVN,无法进行提交或备份文件。         Git   分布式的版本控制系统,在每个使  用者电脑上就有一个完整的数据仓库,  没有网络依然

  • TiDB 数据库的四大应用场景分析2019-09-14 11:43:17

    TiDB是一套开源分布式HTAP(Hybrid Transactional/Analytical Processing 数据库,同时提供 MySQL 与 Spark SQL 接口。TiDB 作为一款 HTAP 数据库,在高性能的实现 OLTP 特性基础之上,也同时提供基于实时交易数据的实时业务分析需求,来看一下TiDB 的设计思路、现实应用场景,以及 Ti

  • 数据仓库系列 - 缓慢渐变维度2019-09-13 15:55:57

    在从 OLTP 业务数据库向 DW 数据仓库抽取数据的过程中,特别是第一次导入之后的每一次增量抽取往往会遇到这样的问题:业务数据库中的一些数据发生了更改,到底要不要将这些变化也反映到数据仓库中?在数据仓库中,哪些数据应该随之变化,哪些可以不用变化?考虑到这些变化,在数据仓库中的维

  • python数据挖掘试题四十道,你敢来挑战吗?2019-09-12 22:36:11

    自从毕业后,你多久没有进行过考试了?如果再给你一次重新考试的机会,你会怎么考?今天分享给大家的是python数据挖掘试题四十道,文末有答案,但希望你从接受挑战那一刻起,就像期末考试一样对待! 1.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的

  • 数据库分类:SQL数据库-NoSQL数据库2019-09-11 18:07:25

    一、数据库产品   二.SQL数据库 SQL:是所有关系型数据库的公共语言; 关系型数据库,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据,我们平常使用的数据库,像MySQL,Oracle,SQL Server等都是传统的关系型数据库。 关系模型指的就是二维表格模型,

  • 数据仓库简单介绍2019-09-10 14:52:03

    https://www.cnblogs.com/hbsygfz/p/4759680.html 人们对数据的处理行为可以分为操作型数据处理和分析型数据处理,操作型数据处理一般放在传统的数据库(DB)中进行,分析型数据处理则需要放在数据仓库(DW)中进行。但是并不是所有的数据处理都可以这样划分,换句话说,人们对数据的处理需求并

  • 如果你也想做实时数仓…2019-09-10 10:01:18

    数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务,数据仓库的建设也是“数据智能”中必不可少的一环。本文将从数据仓库的简介、经历了怎样的发展、如何建设、架构演变、应用案例以及实时数仓与离线数仓的对比六个方面全面分享关于数仓的详细内容。 1.数据仓库简

  • 【艾琪出品】-【大数据导论】测试题系列一2019-09-09 22:01:54

    原文链接:http://qiqii.site/thread-204.htm 【声明】本博客内容,若有侵权请告之,会删除 非商业用途,如有侵权,请告知我,我会删除 如回复不及时,或不懂的请加我 微信 island68  QQ823173334  可以的话注明来自CSDN 很希望通过CSDN这个平台与大家交流

  • Hive数据仓库(三)----基础知识2019-09-09 21:08:07

    前面讲了一些数据仓库的安装和DDL的基本使用以及hive的简单架构,只要你熟悉基本的sql,就能够进行基本的hive数据分析。 当然,我们还是得区分一般传统数据库和hive,毕竟sql不能完全适用hive,一些基础知识还是要掌握的。 内部表和外部表 我们常用的表一般就是内部表(inner),它时hive默

  • 数据湖的概念以及解决方案2019-09-09 10:04:40

    今天这篇文章主要介绍数据湖(data lake)的定义,其次介绍各大云厂商的解决方案以及目前的开源解决方案。 定义 看下维基百科的定义:数据湖是一个以原始格式(通常是对象块或文件)存储数据的系统或存储库。数据湖通常是所有企业数据的单一存储。用于报告、可视化、高级分析和机器学习等任

  • 数据仓库的初识2019-09-04 18:02:44

    数据仓库技术 https://blog.csdn.net/zzq900503/article/details/78405958#commentBox 从功能结构划分,数据仓库系统至少应该包含数据获取(Data Acquisition)、数据存储(Data Storage)、数据访问(Data Access)三个关键部分。 一、数据获取 实现ETL转换的过程体现为以下几个方面: 1

  • Hive(数据仓库)Hive 的查询语法、shell参数、函数2019-09-02 20:38:56

    4. Hive 查询语法 4.1. SELECT SELECT [ALL | DISTINCT] select_expr, select_expr, ... FROM table_reference [WHERE where_condition] [GROUP BY col_list [HAVING condition]] [CLUSTER BY col_list | [DISTRIBUTE BY col_list] [SORT BY| ORDER BY col_list] ] [LIMIT

  • Hive(数据仓库)数据压缩、数据存储格式2019-09-02 20:35:47

    7.hive的数据压缩 在实际工作当中,hive当中处理的数据,一般都需要经过压缩,前期我们在学习hadoop的时候,已经配置过hadoop的压缩,我们这里的hive也是一样的可以使用压缩来节省我们的MR处理的网络带宽 **7.1 **MR支持的压缩编码 压缩格式 工具 算法 文件扩展名 是否可切分

  • 大数据模块开发----数据仓库设计2019-08-28 10:56:06

    1. 维度建模基本概念 维度建模(dimensional modeling)是专门用于分析型数据库、数据仓库、数据集市建模的方法。数据集市可以理解为是一种"小型数据仓库"。 维度表(dimension) 维度表示你要对数据进行分析时所用的一个量,比如你要分析产品销售情况, 你可以选择按类别来进行分析,或

  • 数据百问系列之四:产品经理的能力期望2019-08-27 21:39:08

    本次讨论的主题是:对于数据产品经理的突出能力,你更看重哪一方面? 问题描述: 现在有两个产品可能会和你合作: 1、 一个产品,不懂技术细节,但是能给你带来业务价值,能帮你把数仓推广到全公司,帮你在老板前露脸 2、另一个产品,对数仓很了解,甚至能帮你设计一套数据仓库,可能比你设计的还

  • 数据仓库hive安装教程2019-08-27 18:00:29

    注:该教程转自厦门大学大数据课程学习总结 一、安装hive 1. 下载好hive之后,解压hive源程序 sudo tar -zxvf ./apache-hive-1.2.1-bin.tar.gz -C /usr/local # 解压到/usr/local中 cd /usr/local/ sudo mv apache-hive-1.2.1-bin hive # 将文件夹名改为hive sudo chown -R

  • ETL子系统2019-08-26 11:00:48

      最近在看《Pentaho Kettle 解决方案》,看到 ETL子系统,发现信息量比较大,用简短的语句做一下笔记。   ETL子系统有34种子系统,被分成4个部分:抽取、清洗和更正、发布、管理。 一、抽取  子系统1:数据剖析系统   指从不同源系统中搜集数据的统计信息或其他相关信息的过程,目的是

  • 徐宾完全可以用大案牍术发大财赚取萨珊金币。玄宗去世10年后另一位神童宰相用算法平抑物价2019-08-25 09:00:08

    “ 可以在两个方向做改进:做一套数据仓库,建立缓存系统。这样李必查徐宾的信息立等可取,按索引翻书就可以查到,不需要现算。延州石脂入城记录则需要查缓存系统。” 长安十二时辰 (2019)导演: 曹盾编剧: 爪子工作室 / 马伯庸主演: 雷佳音 / 易烊千玺 / 周一围 / 芦芳生 / 热依扎

  • 8. 数据仓库的建设2019-08-20 23:53:25

    8.1 什么是数据仓库        数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业级所有级别的决策制定过程,提供所有类型数据支持的战略集合。它出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及

  • Hadoop三大组件以及Hive的基础认知2019-08-14 14:02:04

    Hadoop三大组件: 分布式文件系统:HDFS —— 实现将文件分布式存储在很多的服务器上(分布式存储) 分布式运算编程框架:MapReduce——实现多台机器的分布式并行运算。(分布式运算) 分布式资源调度平台:YARN —— 帮用户调度大量的mapreduce程序,并合理分配运算资源 Hive 入门 Hive构建在Hadoo

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有