Partition

Oracle积累2021-09-06 13:32:46

Oracle去除数据的常用方法 dinstinctrow_number() select * from (select t1.*, row_number() over(partition by t1.col_2, t1.col_3 order by 1) rn from nayi224_180824 t1) t1 where t1.rn = 1 ; 针对指定列，查出所有重复行 select * from
Hive外部表操作alter加载数据，并解决空问题2021-09-06 11:32:15

CREATE TABLE test1 ( no bigint, tm bigint, val string --p_date string COMMENT 'partition date, yyyyMMdd' ) partitioned by(p_date string COMMENT 'partition date, yyyyMMdd') row format delimited fields terminated by ',' stored
《深入理解Kafka：核心设计与实践原理》读书笔记2021-09-04 20:04:22

第一章初识Kafka Kafka定位为一个分布式流处理平台，它以高吞吐、可持久化、可水平扩展、支持流数据处理等多种特性而被广泛使用。一个典型的Kafka体系架构包含若干Producer、若干Broker、若干Consumer，以及一个Zookeeper集群。 Zookeeper用来负责集群元数据的管理、控制器的选举等
装win10系统时遇到的一些问题2021-09-04 11:03:33

在分磁盘空间时遇到：在EFI系统上，Windows只能安装到GPT磁盘如图所示，windows无法安装，无论是格式化还是删除分区都没有办法搞定，这是因为你的磁盘是老式的MBR分区表的缘故，多半是你系统之前是安装的windows7的缘故。首先使用u盘启动，进入安装界面，选择现在安装。接着在选择语言的
启动kafka报错22021-08-25 15:02:20

执行启动kafka服务的命令时报错：nohup bin/kafka-server-start.sh config/server.properties 2>&1 & [2019-07-28 12:58:44,760] ERROR [ReplicaManager broker=1] Error while making broker the follower for partition Topic: __consumer_offsets; Partition: 41; Leader: N
row_number() over partition by 分组聚合2021-08-24 23:01:18

分组聚合，就是先分组再排序，可以的话顺手标个排名；如果不想分组也可以排名；如果不想分组同时再去重排名也可以 ROW_NUMBER() OVER( [PARTITION BY column_1, column_2,…] [ORDER BY column_3,column_4,…] ) Oracle和SQL server的关键字是over partition by mysql的无关
PARTITION BY ORDER BY组合使用2021-08-24 18:58:34

在with语句中使用PARTITION BY order by WITH ranking AS ( SELECT country, city, RANK() OVER(PARTITION BY country ORDER BY rating DESC) AS `rank` FROM store ) SELECT country, city FROM ranking WHERE `rank` = 1; PARTITION BY ORDER BY 和
我这三年被kafka坑惨了2021-08-20 22:01:50

前言我的上家公司是做餐饮系统的，每天中午和晚上用餐高峰期，系统的并发量不容小觑。为了保险起见，公司规定各部门都要在吃饭的时间轮流值班，防止出现线上问题时能够及时处理。我当时在后厨显示系统团队，该系统属于订单的下游业务。用户点完菜下单后，订单系统会通过发kafka消息给我们系
第六章 Hive进阶使用2021-08-17 10:32:41

一、创建数据库 #1.创建一个数据库，数据库在HDFS上的默认存储路径是/user/hive/warehouse/*.db。 hive (default)> create database db_hive; #2.避免要创建的数据库已经存在错误，增加if not exists判断。（标准写法） hive (default)> create database if not exists db_hive; #3.创
消息队列2021-08-16 12:32:39

1.kafka: 吞吐量大，性能好，集群高可用。有可丢消息。 2.rabitmaq 不丢消息，吞吐量低 3，rocktmq ; 高吞吐，高可用，相对于rabitmq的。只支持mq。消息丢失：生产者有个回调，有一个偏移去记录kafka 的消费。可靠性：自动提交关闭，保证了消息不会丢失，手动提交。消息重复消费的处理：，　　3
DataWork之 MaxComputer的使用2021-08-12 12:06:08

注意: 由于MaxComputer里面没有主键默认主键为保单号+8位险种代码+责任起期(这个目前用不到) 所以每次join的时候,where条件需要加上 a.主键 =b.主键进行筛选下面是各个函数的API,有需要直接按照需求搜 0.1 日期函数汇总 MaxCompute SQL提供了常见的日期函数，您可以根据实际
Python简单使用kafka2021-08-09 23:02:45

在Windows上安装kafka可以参考： https://blog.csdn.net/weixin_38004638/article/details/91893910 简介 Kafka是分布式流处理系统（RabbitMQ仅仅只是消息队列），是一个分布式、分区的、多副本的、多订阅者，基于Zookeeper协调的分布式日志系统。kafka的吞吐量是很高的，至于为什么这么高可
数据结构与算法之美-4 排序算法2 [MD]2021-08-07 23:31:34

博文地址我的GitHub 我的博客我的微信我的邮箱 baiqiantao baiqiantao bqt20094 baiqiantao@sina.com 目录目录目录12 | 排序（下）：如何用快排思想在O(n)内查找第K大元素？归并排序和快速排序的区别归并排序 Merge Sort代码实现合并函数分析稳定性分析时间复杂度空间复杂
Mysql创建表时同时进行分区2021-08-07 09:05:52

1、创表语句-使用range分区 create table t_range(id int primary key auto_increment,name varchar(10)) partition by range(id) ( partition p0 values less than (1000000), partition p1 values less than (2000000), partition p2 values less than maxvalue
Hive动态分区2021-08-05 13:05:32

Hive动态分区一）hive中支持两种类型的分区：二）实战演示如何在hive中使用动态分区一）hive中支持两种类型的分区：静态分区SP（static partition）动态分区DP（dynamic partition）静态分区与动态分区的主要区别在于静态分区是手动指定，而动态分区是通过数据来进行判断。详细来说，静态
Kafka的架构2021-08-03 16:33:51

一、Kafka的架构如上图所示，一个典型的Kafka集群中包含若干Producer（可以是web前端产生的Page View，或者是服务器日志，系统CPU、Memory等），若干broker（Kafka支持水平扩展，一般broker数量越多，集群吞吐率越高），若干Consumer Group，以及一个Zookeeper集群。Kafka通过Zookeeper管理集群配置，
处理小数2021-08-03 14:01:17

# coding=utf-8 # Time : 2021-08-01 # Author : wangkaiyu # 保留一位小数 def deal_with_float(num, n): num = str(num) a, b, c = num.partition(".") c = c[:n] return float(".".join([a, c])) # 去除小数点 def del_point(num): num
分库分表2021-08-03 09:33:42

转自：https://www.cnblogs.com/littlecharacter/p/9342129.html 一、数据库瓶颈不管是IO瓶颈，还是CPU瓶颈，最终都会导致数据库的活跃连接数增加，进而逼近甚至达到数据库可承载活跃连接数的阈值。在业务Service来看就是，可用数据库连接少甚至无连接可用。接下来就可以想象了吧（并发量、
kafka教程2021-08-01 22:57:37

1.kafka 系统架构 1.1 broker kafka 集群包含一个或多个服务器，服务器节点称为 broker。 1.2 Tpoic 每条发布到 kafka 集群的消息都有一个类别，这个类别称为 Topic。类似于数据的表名。物理上不同的 Topic 的消息分开存储。逻辑上一个 Topic 的消息虽然保存于一个或多个 broker
教你如何增加拿到BAT大厂offer几率，详解系列文章2021-07-31 13:02:38

Kafka的多副本冗余设计不管是传统的基于关系型数据库设计的系统，还是分布式的如zookeeper、redis、Kafka、HDFS等等，实现高可用的办法通常是采用冗余设计，通过冗余来解决节点宕机不可用问题。首先简单了解Kafka的几个概念：物理模型逻辑模型 Broker（节点）：Kafka服务节点，简单来
[LeetCode] 763. Partition Labels_Medium Tag: sort2021-07-29 09:02:34

763. Partition Labels Medium 5066206Add to ListShare You are given a string s. We want to partition the string into as many parts as possible so that each letter appears in at most one part. Return a list of integers representing the size of these par
Kafka 的简介与架构2021-07-28 18:58:44

一、简介 1.1 概述 Kafka是最初由Linkedin公司开发，是一个分布式、分区的、多副本的、多订阅者，基于zookeeper协调的分布式日志系统（也可以当做MQ系统），常见可以用于web/nginx日志、访问日志，消息服务等等，Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。主要应用场景是：日
数据直接上传到分区目录上，让分区表和数据产生关联的三种方式2021-07-25 20:32:44

1 把数据直接上传到分区目录上，让分区表和数据产生关联的三种方式 1.1 上传数据后修复上传数据 dfs -mkdir -p /user/dept_partition/day=20210725/hour=8 dfs -put /opt/apps/dept_20210725.log /user/dept_partition/day=20210725/hour=8 查询数据 select * from dept_part
关于hive核心2021-07-24 13:02:22

一、DDL数据定义 1、创建数据库 1）创建一个数据库，数据库在 HDFS 上的默认存储路径是/user/hive/warehouse/*.db。 hive (default)> create database db_hive; 2）避免要创建的数据库已经存在错误，增加 if not exists 判断。（标准写法） hive (default)> create database db_hive; FAILE
高通QFIL dump 整个flash镜像2021-07-24 12:34:14

目录导出为一个partition.bin的方案导出所有分区的方案导出为一个partition.bin的方案通常QFIL下载的xml，我们使用高通提供的ptool工具(本人之前的文章中有提到)生成的rawprogram0_BLANK_GPT.xml可以派上用场，另外需要普及一个简单的概念 program 在高通的xml配置中表示下

首页 < 6 7 8

ICode9

Oracle积累2021-09-06 13:32:46

Hive外部表操作alter加载数据，并解决空问题2021-09-06 11:32:15

《深入理解Kafka：核心设计与实践原理》读书笔记2021-09-04 20:04:22

装win10系统时遇到的一些问题2021-09-04 11:03:33

启动kafka报错22021-08-25 15:02:20

row_number() over partition by 分组聚合2021-08-24 23:01:18

PARTITION BY ORDER BY组合使用2021-08-24 18:58:34

我这三年被kafka坑惨了2021-08-20 22:01:50

第六章 Hive进阶使用2021-08-17 10:32:41

消息队列2021-08-16 12:32:39

DataWork之 MaxComputer的使用2021-08-12 12:06:08

Python简单使用kafka2021-08-09 23:02:45

数据结构与算法之美-4 排序算法2 [MD]2021-08-07 23:31:34

Mysql创建表时同时进行分区2021-08-07 09:05:52

Hive动态分区2021-08-05 13:05:32

Kafka的架构2021-08-03 16:33:51

处理小数2021-08-03 14:01:17

分库分表2021-08-03 09:33:42

kafka教程2021-08-01 22:57:37

教你如何增加拿到BAT大厂offer几率，详解系列文章2021-07-31 13:02:38

[LeetCode] 763. Partition Labels_Medium Tag: sort2021-07-29 09:02:34

Kafka 的简介与架构2021-07-28 18:58:44

数据直接上传到分区目录上，让分区表和数据产生关联的三种方式2021-07-25 20:32:44

关于hive核心2021-07-24 13:02:22

高通QFIL dump 整个flash镜像2021-07-24 12:34:14