ICode9

精准搜索请尝试: 精确搜索
  • Oracle积累2021-09-06 13:32:46

    Oracle去除数据的常用方法 dinstinctrow_number() select * from (select t1.*, row_number() over(partition by t1.col_2, t1.col_3 order by 1) rn from nayi224_180824 t1) t1 where t1.rn = 1 ;  针对指定列,查出所有重复行 select * from

  • Hive外部表操作alter加载数据,并解决空问题2021-09-06 11:32:15

    CREATE TABLE test1 ( no bigint, tm bigint, val string --p_date string COMMENT 'partition date, yyyyMMdd' ) partitioned by(p_date string COMMENT 'partition date, yyyyMMdd') row format delimited fields terminated by ',' stored

  • 《深入理解Kafka:核心设计与实践原理》读书笔记2021-09-04 20:04:22

    第一章 初识Kafka Kafka定位为一个分布式流处理平台,它以高吞吐、可持久化、可水平扩展、支持流数据处理等多种特性而被广泛使用。 一个典型的Kafka体系架构包含若干Producer、若干Broker、若干Consumer,以及一个Zookeeper集群。 Zookeeper用来负责集群元数据的管理、控制器的选举等

  • 装win10系统时遇到的一些问题2021-09-04 11:03:33

    在分磁盘空间时遇到:在EFI系统上,Windows只能安装到GPT磁盘 如图所示,windows无法安装,无论是格式化还是删除分区都没有办法搞定,这是因为你的磁盘是老式的MBR分区表的缘故,多半是你系统之前是安装的windows7的缘故。 首先使用u盘启动,进入安装界面,选择现在安装。 接着在选择语言的

  • 启动kafka报错22021-08-25 15:02:20

    执行启动kafka服务的命令时报错:nohup bin/kafka-server-start.sh config/server.properties 2>&1 & [2019-07-28 12:58:44,760] ERROR [ReplicaManager broker=1] Error while making broker the follower for partition Topic: __consumer_offsets; Partition: 41; Leader: N

  • row_number() over partition by 分组聚合2021-08-24 23:01:18

    分组聚合,就是先分组再排序,可以的话顺手标个排名;如果不想分组也可以排名;如果不想分组同时再去重排名也可以 ROW_NUMBER() OVER( [PARTITION BY column_1, column_2,…] [ORDER BY column_3,column_4,…] ) Oracle和SQL server的关键字是over partition by mysql的无关

  • PARTITION BY ORDER BY组合使用2021-08-24 18:58:34

    在with语句中使用PARTITION BY order by WITH ranking AS ( SELECT country, city, RANK() OVER(PARTITION BY country ORDER BY rating DESC) AS `rank` FROM store ) SELECT country, city FROM ranking WHERE `rank` = 1; PARTITION BY ORDER BY 和

  • 我这三年被kafka坑惨了2021-08-20 22:01:50

    前言 我的上家公司是做餐饮系统的,每天中午和晚上用餐高峰期,系统的并发量不容小觑。为了保险起见,公司规定各部门都要在吃饭的时间轮流值班,防止出现线上问题时能够及时处理。 我当时在后厨显示系统团队,该系统属于订单的下游业务。用户点完菜下单后,订单系统会通过发kafka消息给我们系

  • 第六章 Hive进阶使用2021-08-17 10:32:41

    一、创建数据库 #1.创建一个数据库,数据库在HDFS上的默认存储路径是/user/hive/warehouse/*.db。 hive (default)> create database db_hive; #2.避免要创建的数据库已经存在错误,增加if not exists判断。(标准写法) hive (default)> create database if not exists db_hive; #3.创

  • 消息队列2021-08-16 12:32:39

    1.kafka: 吞吐量大, 性能好, 集群高可用。 有可丢消息。 2.rabitmaq 不丢消息, 吞吐量低 3,rocktmq ; 高吞吐,高可用,相对于rabitmq的。 只支持mq。 消息丢失: 生产者 有个回调,有一个偏移去记录kafka 的消费。可靠性:自动提交关闭,保证了消息不会丢失,手动提交。 消息重复消费的处理 :,   3

  • DataWork之 MaxComputer的使用2021-08-12 12:06:08

    注意: 由于MaxComputer里面没有主键 默认主键为 保单号+8位险种代码+责任起期(这个目前用不到) 所以每次join的时候,where条件需要加上 a.主键 =b.主键 进行筛选 下面是各个函数的API,有需要直接按照需求搜 0.1 日期函数汇总 MaxCompute SQL提供了常见的日期函数,您可以根据实际

  • Python简单使用kafka2021-08-09 23:02:45

    在Windows上安装kafka可以参考: https://blog.csdn.net/weixin_38004638/article/details/91893910 简介 Kafka是分布式流处理系统(RabbitMQ仅仅只是消息队列),是一个分布式、分区的、多副本的、多订阅者,基于Zookeeper协调的分布式日志系统。kafka的吞吐量是很高的,至于为什么这么高可

  • 数据结构与算法之美-4 排序算法2 [MD]2021-08-07 23:31:34

    博文地址 我的GitHub 我的博客 我的微信 我的邮箱 baiqiantao baiqiantao bqt20094 baiqiantao@sina.com 目录 目录目录12 | 排序(下):如何用快排思想在O(n)内查找第K大元素?归并排序和快速排序的区别归并排序 Merge Sort代码实现合并函数分析稳定性分析时间复杂度空间复杂

  • Mysql创建表时同时进行分区2021-08-07 09:05:52

    1、创表语句-使用range分区 create table t_range(id int primary key auto_increment,name varchar(10)) partition by range(id) ( partition p0 values less than (1000000), partition p1 values less than (2000000), partition p2 values less than maxvalue

  • Hive动态分区2021-08-05 13:05:32

    Hive动态分区 一)hive中支持两种类型的分区:二)实战演示如何在hive中使用动态分区 一)hive中支持两种类型的分区: 静态分区SP(static partition)动态分区DP(dynamic partition) 静态分区与动态分区的主要区别在于静态分区是手动指定,而动态分区是通过数据来进行判断。详细来说,静态

  • Kafka的架构2021-08-03 16:33:51

    一、Kafka的架构   如上图所示,一个典型的Kafka集群中包含若干Producer(可以是web前端产生的Page View,或者是服务器日志,系统CPU、Memory等),若干broker(Kafka支持水平扩展,一般broker数量越多,集群吞吐率越高),若干Consumer Group,以及一个Zookeeper集群。Kafka通过Zookeeper管理集群配置,

  • 处理小数2021-08-03 14:01:17

    # coding=utf-8 # Time : 2021-08-01 # Author : wangkaiyu # 保留一位小数 def deal_with_float(num, n): num = str(num) a, b, c = num.partition(".") c = c[:n] return float(".".join([a, c])) # 去除小数点 def del_point(num): num

  • 分库分表2021-08-03 09:33:42

    转自:https://www.cnblogs.com/littlecharacter/p/9342129.html 一、数据库瓶颈 不管是IO瓶颈,还是CPU瓶颈,最终都会导致数据库的活跃连接数增加,进而逼近甚至达到数据库可承载活跃连接数的阈值。在业务Service来看就是,可用数据库连接少甚至无连接可用。接下来就可以想象了吧(并发量、

  • kafka教程2021-08-01 22:57:37

    1.kafka 系统架构 1.1 broker kafka 集群包含一个或多个服务器,服务器节点称为 broker。 1.2 Tpoic 每条发布到 kafka 集群的消息都有一个类别,这个类别称为 Topic。类似于数据的表名。物理上不同的 Topic 的消息分开存储。逻辑上一个 Topic 的消息虽然保存于一个或多个 broker

  • 教你如何增加拿到BAT大厂offer几率,详解系列文章2021-07-31 13:02:38

    Kafka的多副本冗余设计 不管是传统的基于关系型数据库设计的系统,还是分布式的如zookeeper、redis、Kafka、HDFS等等,实现高可用的办法通常是采用冗余设计,通过冗余来解决节点宕机不可用问题。 首先简单了解Kafka的几个概念: 物理模型 逻辑模型 Broker(节点):Kafka服务节点,简单来

  • [LeetCode] 763. Partition Labels_Medium Tag: sort2021-07-29 09:02:34

    763. Partition Labels Medium 5066206Add to ListShare You are given a string s. We want to partition the string into as many parts as possible so that each letter appears in at most one part. Return a list of integers representing the size of these par

  • Kafka 的简介与架构2021-07-28 18:58:44

    一、简介 1.1 概述 Kafka是最初由Linkedin公司开发,是一个分布式、分区的、多副本的、多订阅者,基于zookeeper协调的分布式日志系统(也可以当做MQ系统),常见可以用于web/nginx日志、访问日志,消息服务等等,Linkedin于2010年贡献给了Apache基金会并成为顶级开源项目。 主要应用场景是:日

  • 数据直接上传到分区目录上,让分区表和数据产生关联的三种方式2021-07-25 20:32:44

    1 把数据直接上传到分区目录上,让分区表和数据产生关联的三种方式 1.1 上传数据后修复 上传数据 dfs -mkdir -p /user/dept_partition/day=20210725/hour=8 dfs -put /opt/apps/dept_20210725.log /user/dept_partition/day=20210725/hour=8 查询数据 select * from dept_part

  • 关于hive核心2021-07-24 13:02:22

    一、DDL数据定义 1、创建数据库 1)创建一个数据库,数据库在 HDFS 上的默认存储路径是/user/hive/warehouse/*.db。 hive (default)> create database db_hive; 2)避免要创建的数据库已经存在错误,增加 if not exists 判断。(标准写法) hive (default)> create database db_hive; FAILE

  • 高通QFIL dump 整个flash镜像2021-07-24 12:34:14

    目录 导出为一个partition.bin的方案 导出所有分区的方案 导出为一个partition.bin的方案 通常QFIL下载的xml,我们使用高通提供的ptool工具(本人之前的文章中有提到)生成的rawprogram0_BLANK_GPT.xml可以派上用场,另外需要普及一个简单的概念 program 在高通的xml配置中表示下

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有