ICode9

精准搜索请尝试: 精确搜索
  • 有关我的一些“有趣”的事实2022-07-20 12:31:07

    绝无任何怨天尤人或愤世嫉俗之意,写此文只为博君一笑罢了 LN有一个神奇的现象:经常产生Ag倒数第一(包括2018、2019、2021年),直至2020年被我打破 我经历过极少会发生的情况:能在国赛被工作人员弄丢代码,笔试提交失败 高中以来好像很多事情都会差一丁点:高一差两名银牌,高二因为极其低级失

  • <沃兹传>2022-07-06 21:33:35

    开发了 Apple I, Apple II 1. 注重工程师文化(惠普) 2. 工程师属性: 灰度思考(独立思考,避免非黑即白的误区,以事实为依据) 3. 快乐是最重要的事 4. 可以不认同对方的做法,甚至断绝关系,但是没必要与对方决裂,要接受人与人性格不同这一事实,这就是快乐生活的窍门。 5. 富有人文关怀, 关注

  • 离线数仓 建模、表的类型分类2022-06-15 09:32:51

    关系建模:遵循三范式 1.基本字段不可再分割 2.其他字段对主键完全依赖 3.其他字段间不存在传递依赖关系 维度建模:星型模型 雪花模型 星座模型   实体表 维度表(码表) 事实表 事实表的分类:事务型事实表 周期型快照事实表 累积型快照事实表 按数据同步分类: 全量表 增量表 同步新增

  • 【数仓项目记录3】业务数据采集2022-05-02 12:32:09

    电商常识 业务表,与用户的操作相关,如添加收藏夹、购物车,下单,支付,退单、退款、评价、领优惠券等 后台管理系统面向公司内部开发者,维护商品信息、优惠信息等 业务数据的生成 使用项目提供的jar包生成某一日期下的数据,数据存储到hadoop102中的数据库中 Sqoop Sqoop是Hadoop和关系

  • 数据仓库建模(三):事实表的设计2022-03-20 17:00:35

    数据仓库建模(三):事实表的设计 事实表结构可加、半可加、不可加事实事实表中的空值一致性事实(事实表中字段命名尽量保持统一)事务事实、周期性快照事实表、累计快照事实表、无事实的事实表 事实表结构 事实表中每一行对应一个度量事件,反之亦然,比如订单表,每一行对应一个用

  • 制作PPT方法论2022-02-21 12:01:12

    第一地图写作法、让领导一眼就看到你的核心思路是什么。学会用架构来呈现信息,真篇文章就会显得更加简洁,也容易懂 第二要是优先、汇报、开头是黄金部分,一定要吧重要的行动方案、主张、观点、全部说出来,重要的事情一定要放到开头说清楚 第三积木检查、汇报这类文本里面,有一类细节值

  • MySQL 到 ElasticSearch 宽表构建和同步CloudCanal实战2022-01-06 16:02:01

    简述 CloudCanal 2.0.X 版本近期支持了宽表构建能力,在数据预处理领域向前走了一步。 方案特点 相对灵活,对业务数据和结构贴合性好能很好的支持事实表与维表打宽表需求 本文以 MySQL 到 ElasticSearch6 单事实表双维表为案例,介绍 CloudCanal 宽表构建和同步的操作步骤。 技术

  • 数据仓库之DWD层2022-01-02 23:31:10

    DWD(Data WareHouse Detail)数据明细层,主要是将从业务数据库中同步过来的ODS层数据进行清洗和整合成相应的事实表。事实表作为数据仓库维度建模的核心,需要紧紧围绕着业务过程来设计。在拿到业务系统的表结构后,进行大概的梳理,再与业务方沟通整个业务过程的流转过程,对业务的整个生命

  • 软件测试中7个令人吃惊的事实2021-12-30 15:58:55

    这是最近看到的一篇比较有意思的文章,原文在这里:https://medium.com/geekculture/seven-unspoken-truths-about-software-tests-4bcf0f720a04,简单的加工翻译了一下,其中()里的内容是我为了帮助大家理解夹带的私货,希望这篇文章会对大家有所启示。 1,当你是一个项目的的测试负责人的时

  • 最重要的资源是什么?2021-12-19 21:35:22

    前言 对于一个普通家庭的学生而言,最重要的资源是什么?这个问题很难回答,很轻易说出很多答案,但细想都会觉得有失偏颇。例如:好的教育,好的家庭等。 想找到这个问题的答案,或许我们可以从与之相关的另一个问题中获得启发。这个问题是,对国家而言,最重要的资源是什么? 对于这个问题,我国政府是

  • 大数据之数据仓库Data Warehouse总结2021-12-11 14:30:57

    数据仓库Data Warehouse 数据处理方式 OLTP 全称是On-line Transaction Processing 联机事务处理专注于事务,crud操作 OLAP 称是 On-line Analytical Processing 中文名称是联机分析处理 专注查询和分析 OLAP基本操作 上卷:roll-up drill-up 通过一个维的概念分层向上攀

  • 明细数据层(DWD)2021-12-01 13:59:40

    事实表设计原则 尽可能包含所有与业务过程相关的事实。 设计事实表的目的是度量业务过程,所以分析哪些事实与业务过程有关,是事实表设计中至关重要的。在事实表中应该尽量包含所有与业务过程相关的事实,即使存在冗余,但是因为事实通常为数字型,带来的存储开销不会很大。 只选择与业务

  • 数据仓库建模2021-11-25 14:04:13

    DataWareHouse数据建模 文章目录 DataWareHouse数据建模什么是数据建模?什么是数据模型?数据仓库模型的组成为什么需要数据模型?数据仓库的发展大致经历了三个过程 数据仓库数据模型架构最后引出什么是数据建模? 维度表的分类事实表维度表总结数据组织类型星型模型雪花模型星座

  • 三元组抽取 调研2021-11-12 14:01:29

    1、依存关系法: 基于依存句法分析的事实三元组抽取 如何抽取实体关系?——基于依存句法分析的事实三元组抽取 - 编程、生活、技巧、认知、理财 (guanngxu.com)

  • 业务分析逻辑的思考2021-10-24 06:00:38

    两种分析逻辑 对于业务分析而言,很多方法论中会非常明确的说明,需要先定一个目标,之后才能再进行评价好坏,是否达标,差多少,需要做啥 但是实际工作中,很多分析工作并没有明确的“目标”,而是在一种非常开放的语境下去探索这个新功能/新业务带来的影响。在不断的探索挖掘下,得到一些洞察跟

  • dws公共汇总粒度事实层设计2021-10-14 12:00:22

    目录 1-dws公共汇总粒度事实层介绍2-dws事实层设计原则3-dws事实表设计规范4-dws建表示例 1-dws公共汇总粒度事实层介绍 公共汇总粒度事实层DWS(Data Warehouse Summary)以分析的主题对象作为建模驱动,基于上层的应用和产品的指标需求构建公共粒度的汇总指标事实表。公共汇

  • 索罗斯投资理论2021-10-11 21:00:52

    1、彻底可错性思想 人类对置身其中的世界的认识,与生俱来就是不完整的,亦即人们的思维与客观实在之间永远存在着扭曲,世界上不可能有人掌握了终极真理。 所有人类心灵的建构,不论建构局限在我们思维深处或表现为各种学科、各种意识形态或各种体制,都是有缺陷的。这里的有缺陷不是可能“

  • 数据仓库之缓慢变化维解决方案2021-09-24 14:02:10

    目录 1-背景2-解决方案2.1-重写维度值2.2-插入新的维度行2.3-添加新的维度列2.4-拉链表处理 1-背景 众所周知,虽然维度表属性相对稳定,但是并不是一成不变的,尽管相当缓慢,维度值仍会随时间而变化。比如商品类目的改变,医院等级的改变。 在一些情况下,保留历史数据没有什么分析

  • 数仓建模2021-09-24 13:04:17

    订阅专栏 1.数据仓库建模的目的? 为什么要进行数据仓库建模?大数据的数仓建模是通过建模的方法更好的组织、存储数据,以便在 性能、成本、效率和数据质量之间找到最佳平衡点。一般主要从下面四点考虑 访问性能:能够快速查询所需的数据,减少数据I/O 数据成本:减少不必要的数据冗

  • 数仓中指标-标签,维度-度量,自然键-代理键等各名词解析及关系2021-09-09 14:03:39

    作为一个数据人,是不是经常被各种名词围绕,是不是对其中很多概念认知模糊。有些词虽然只有一字之差,但是它们意思完全不同,今天我们就来了解下数仓建设及数据分析时常见的一些概念含义及它们之间的关系。 本文结构如下图所示: 一、数仓中常见概念解析 1. 实体 实体是指依附的主体,就是

  • 06Ansible事实、循坏、条件判断2021-07-25 16:58:13

    事实、循环、条件判断 1.管理事实1.1Ansible事实1.2 关闭事实收集1.3 创建自定义事实 2.编写循坏和条件任务2.1利用循环迭代任务2.2简单循坏2 .3循环散列或字典列表2.4较早样式的循坏关键字2.5将Register变量与Loop一起使用2.6有条件地运行任务2.6.1条件任务语法 1.管

  • ansible的事实,循环和条件判断2021-07-24 17:05:21

    1. 管理事实 1.1描述ansible事实 ​ ansible的事实是ansible在受管主机上自动检测到的变量。可以直接再playbook中直接引用的 事实中包括一下一些数据: 主机名称内核版本网络接口IP地址操作系统版本各种环境变量CPU数量提供的或可用的内存可用磁盘空间 借助事实,我们可以更加方

  • DataWarehouse 数据仓库2021-07-15 22:33:32

    DataWarehouse 数据仓库 目录 DataWarehouse 数据仓库1、数据处理方式1.1. OLTP1.2. OLAP1.2.1 OLAP基本操作 2、数据建模2.1. 关系建模2.2. 维度建模 3、维度表分类3.1. 维度表3.2. 事实表 4、数据组织类型4.1. 星型模型4.2. 雪花模型4.3. 星座模型4.4. 模型选择 5、数仓

  • HotpotQA 多跳知识图谱问答数据集 Multi-hop KGQA2021-07-07 20:30:19

    论文地址:HOTPOTQA: A Dataset for Diverse, Explainable Multi-hop Question Answering 论文来源:EMNPL 2018 问题介绍: 问答(QA)的任务提供了一种可量化和客观的方法来测试智能系统的推理能力。而很多数据集却有以下不足,一,一些数据集主要关注在单段落,单文档,单跳的推理能力测试;二,基

  • 数仓维度建模之维度表设计2021-06-21 15:58:56

    维度设计基本方法 1、设计步骤: 1)第一步:选择维度或新建维度。 作为维度建模的核心,在企业级数据仓库中必须保证维度的唯一性。以淘宝商品维度为例,有且只允许有一个维度定义。 2)第二步:确定主维表。 此处的主维表一般是 ODS 表,直接与业务系统同步。以淘宝商品维度为例,s_auction_ auc

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有