ICode9

精准搜索请尝试: 精确搜索
  • CF1630B Range and Partition2022-02-03 16:35:25

    首先看到最小化 y − x y-x y−x 这个玩意,果断二分 y −

  • 42 分区表、分桶表、函数2022-02-03 15:02:04

    分区表 分区表的定义 分区表实际上就是对应一个HDFS文件系统上的独立的文件夹 分区表的基本操作 引入分区表(需要根据日期对日志进行管理, 通过部门信息模拟) dept_20200401.log dept_20200402.log dept_20200403.log …… 创建分区表语法 create table dept_partition( dept

  • Codeforces 1631 D. Range and Partition —— 尺取,贪心,一点点想法2022-01-31 15:03:21

    This way 题意: 给你n个数,你要将其分成k个区间,并且任意一个区间中,值在[x,y]中的数的个数要大于值不在[x,y]中的数的个数。问你y-x要最小的话,x和y分别是什么,并且要将这k个区间的左右端点输出。 题解: 嗨呀,果然是水题以前做太少基础都不扎实了,做到这种有那么一点点需要思考的题

  • Range and Partition (贪心+双指针)2022-01-28 21:34:47

    D. Range and Partition [Link](D. Range and Partition) 题意 给你一个长为 n n n的数组,让你分成 k k

  • hive分区笔记2022-01-28 21:31:56

    hive分区 1.一级分区 Hive 中的分区就是分目录。和Map中的切片是基本一致的。Map的切片也是为了提高并行度。把表中的数据分开放,当你查表里数据的时候写上分区信息,避免全表扫描; 是一个优化的方案。 分区表实际上就是对应一个 HDFS 文件系统上的独立的文件夹,该文件夹下是该分

  • RDD的血缘关系2022-01-24 23:35:41

    窄依赖:窄依赖表示每一个父(上游)RDD 的 Partition 最多被子(下游)RDD 的一个 Partition 使用 宽依赖:宽依赖表示同一个父(上游)RDD 的 Partition 被多个子(下游)RDD 的 Partition 依赖,会引起 Shuffle

  • CAP理论以及kafka当中的CAP机制2022-01-24 22:32:28

    CAP理论以及kafka当中的CAP机制 1.1、分布式系统当中的CAP理论1.2、Partition tolerance1.3、Consistency1.4、Availability1.5、kafka当中的CAP应用 1.1、分布式系统当中的CAP理论 分布式系统(distributed system)正变得越来越重要,大型网站几乎都是分布式的。 分布式系统

  • Doris之动态分区2022-01-22 17:02:00

    动态分区 动态分区是在 Doris 0.12 版本中引入的新功能。旨在对表级别的分区实现生命周期管理(TTL),减少用户的使用负担。 目前实现了动态添加分区及动态删除分区的功能。 动态分区只支持 Range 分区。 原理 在某些使用场景下,用户会将表按照天进行分区划分,每天定时执行例行任

  • Spark SQL 3.0 自适应执行优化引擎2022-01-22 15:01:11

    在本篇文章中,笔者将给大家带来 Spark SQL 中关于自适应执行引擎(Spark Adaptive Execution)的内容。 在之前的文章中,笔者介绍过 Flink SQL,目前 Flink 社区在积极地更新迭代 Flink SQL 功能和优化性能,尤其 Flink 1.10.0 版本的发布,在增强流式 SQL 处理能力的同时也具备了成熟的

  • Partition分区的使用案例2022-01-16 16:04:35

    Partition分区的使用案例: 将统计结果按照条件输出到不同文件中(分区) 文章目录 1)需求2)需求分析3)编程实现1.创建Partitioner类2.创建Bean类3.创建Mapper类4.创建Reducer类 4.查看结果 1)需求 将统计结果按照手机号开头输出到不同文件中 期望输出:手机号 136、137、138、13

  • 创建分区表2022-01-13 17:03:51

    CREATE TABLE "DB19C"."LAB_APPLY" ( "ID" VARCHAR2(100), "OUTPATIENT_NUM" VARCHAR2(100), "NAME" VARCHAR2(180), "ID_NUM" VARCHAR2(180), "CLINIC_EMERGENCY_MARK_CODE" VARCHAR2(180),

  • HIVE日常使用笔记2022-01-12 10:30:45

    1 hive一次性删除多个分区数据 -----SQL------ alter table tranods.name drop if exists partition (dt='20220110') ,partition (dt='20220111') ,partition (dt='20220109') ----结果展示----- Logging initialized using configuration in file:/etc/hive

  • partition生成规则2022-01-10 22:03:56

    partition生成规则 不指定key private Future<RecordMetadata> doSend(ProducerRecord<K, V> record, Callback callback) { TopicPartition tp = null; try { this.throwIfProducerClosed(); long nowMs = this.time.millis

  • 084、Spark-RDD-依赖关系2022-01-08 12:01:54

    这里所谓的依赖关系,其实就是两个相邻RDD之间的关系 1、窄依赖表示每一个父(上游)RDD的Partition最多被子(下游)RDD的一个Partition使用,窄依赖我们形象的比喻为独生子女。 2、宽依赖表示同一个父(上游)RDD的Partition被多个子(下游)RDD的Partition依赖,会引起Shuffle,总结:宽依赖我们形象的

  • PAT刷题之旅 1113-Integer Set Partition-甲级2022-01-05 17:04:39

    题目 Given a set of N (> 1) positive integers, you are supposed to partition them into two disjoint sets A1 and A2 of n1 and n2 numbers, respectively. Let S1 and S2 denote the sums of all the numbers in A1 and A2, respectively. You are supposed to make t

  • 磁盘与磁盘管理2022-01-01 23:32:52

    磁盘及磁盘管理 1、磁盘介绍 SAS硬盘 SAS:串行连接SCSI接口 SAS:serial attached scsi,串行李拦截scsi接口,串行连接小型计算机系统接口 SAS是新一代的SCSI技术,SATA硬盘相同,都是采用串行技术获取高速, SAS的接口是可以兼容SATA 硬盘尺寸 3.5寸涉及 2.5寸涉及 问题:并口硬盘和串口硬

  • airflow 2.21:HivePartitionSensor、自定义宏变量2021-12-31 20:03:30

    HivePartitionSensor功能 用于检查hive表的分区是否存在,在某些场景下可以使用该sensor来替代ExternalTaskSensor,且使用起来更加便捷。 场景描述 在数仓中这么两种表: 表1 :daily_table,该表是按天分区的表,一天跑一次。 表2 :hour_table,该表是按照小时分区,每个小时跑一次。 其中da

  • 周度学习总结-2021-12-312021-12-31 19:02:55

    目录 1. 工作简要2. 学习内容2.1 SQL*PLUS命令2.2 SQL2.3 PL/SQL语言2.4 Oracle归档日志2.5 Oracle控制文件2.6 Oracle重做日志2.7 Oracle表空间2.8 Oracle数据表2.9 Oracle分区技术2.10 Oracle角色2.11 Oracle事务2.12 优化2.13 Oracle备份和恢复2.14 Java连接Oracle数据

  • Kafka高可用,高吞吐量低延迟的高并发的特性背后实现机制2021-12-29 17:06:00

    1 概述 Kafka是最初由Linkedin公司开发,是一个分布式、分区的、多副本的、多订阅者,基于zookeeper协调的分布式消息系统,Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。 2 消息系统介绍 一个消息系统负责将数据从一个应用传递到另外一个应用,应用只需关注于数据,无需关注

  • sql 位置偏移函数2021-12-29 13:34:23

          位置偏移函数用于返回分组内相对位置的成员,主要有FIRST_VALUE、LAST_VALUE、LEAD、LAG,后面跟 over (partition by 分组列名 order by 排序列名)子句。     FIRST_VALUE( ):用于返回分组内首项成员记录     LAST_VALUE( ):用于返回分组内尾项成员记录     LEAD(N):用于

  • Kafka的生产者与消费者解析2021-12-29 10:31:39

    一、生产者 1.分区策略 分区的原因 (1) 方便在集群中扩展 ,每个 Partition 可以通过调整以适应它所在的机器,而一个 topic 又可以有多个 Partition 组成,因此整个集群就可以适应任意大小的数据了。 (2) 可以提高并发 ,因为可以以 Partition 为单位读写了。 分区

  • linux 如何支持2T以上的硬盘2021-12-27 19:59:16

    一、MBR 和 GPT 区别 1.1 MBR MBR分区表(即主引导记录)大家都很熟悉,是过去我们使用windows时常用的 所支持的最大卷:2T,而且对分区有限制:最多4个主分区或3个主分区加一个扩展分区 1.2 GPT GPT(即GUID分区表)。是源自EFI标准的一种较新的磁盘分区表结构的标准,是未来磁盘分区的主要形

  • 第38期:MySQL 时间类分区具体实现2021-12-27 17:32:55

    适用分区或者说分表最多的场景依然是针对时间字段做拆分, 这节我们详细讲讲如何更好的基于时间字段来拆分。分别按照年、月、日几个维度的实现方法以及一些细节注意事项。 第一,以年为维度做拆分 日期字段拆分粒度的选择跟业务检索请求密切相关。比如保留10年数据,每次查询基于

  • postgresql 表分区2021-12-26 18:34:14

    postgresql 表分区 背景 一个大表查询性能往往不高, 其原因在于数据加载 data load,扫描数据 table scans ,内存交换 memory swap 等等操作的时间成本会随着数据量的增加而上升. 从 PG 11 开始, 支持较为简洁的声明表分区. 为提高大表性能提供了一种解决方案. 什么是表分区

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有