partition

partition()、rpartition()2022-07-02 18:01:06

partition() 根据指定的分隔符 (sep) 将字符串进行分割，从字符串左边开始索引分隔符 sep, 索引到则停止索引，返回的是一个包含三个元素的元组 (tuple)，即 (head, sep, tail)。 repartiton()是从后往前开始分割点击查看代码 s = 'hello, welcome to the world' #遇到第一个分隔符后
Hive-day06 Hive分区2022-06-30 09:00:42

Hive分区在大数据中，最常见的一种思想就是分治，我们可以把大的文件切割划分成一个个的小的文件，这样每次操作一个个小的文件就会很容易了，同样的道理，在hive当中也是支持这种思想的，就是我们可以把大的数据，按照每天或者每小时切分成一个个小的文件，这样去操作小的文件就会容易很多了。
Kubernetes——StatefulSet控制器资源的金丝雀部署2022-06-29 16:01:46

金丝雀部署 StatefulSet 控制器的资源一、金丝雀部署将处于暂存状态的更新操作的 partition 定位于 Pod 资源的最大索引号，即可放出一只金丝雀，由其测试第一轮的更新操作，在确认无误后通过修改 partition 属性的值更新其他的 Pod 对象是一种更为稳妥的更新操作。 StatefulSet
[LeetCode] 416. Partition Equal Subset Sum2022-06-28 14:34:15

Given a non-empty array nums containing only positive integers, find if the array can be partitioned into two subsets such that the sum of elements in both subsets is equal. Example 1: Input: nums = [1,5,11,5] Output: true Explanation: The array can be p
Linux磁盘分区、格式化、挂载2022-06-27 22:06:47

目录一、前期准备1）增加一块磁盘2）查看新增磁盘（lsblk），发现没找到新增的磁盘3）解决查不到新增磁盘问题二、分区1）简介2）fdisk 对磁盘进行分区三、磁盘格式化四、挂载1）临时挂载2）永久挂载一、前期准备测试环境：VMware Workstation / centos8 1）增加一块磁盘 2）查看新增磁盘（lsblk），发现没找
虚拟机安装Arch Linux2022-06-26 21:31:17

本次介绍在Hyper-V虚拟机上安装Arch Linux的方法，其它虚拟机平台类似。 1. 创建和启动虚拟机 1.1 下载ArchLinux安装镜像先登录官网下载页面：[https://archlinux.org/download/]. 然后根据喜好选择具体的下载链接，比如我选择通过国内网易163下载镜像文件： [http://mirrors.163.com/ar
leidenalg包教程-12022-06-18 01:00:37

leidenalg包教程目录leidenalg包教程安装介绍高级技巧1. 优化器2. Resolution profile 分辨率配置文件3. 固定（确定）节点安装简单来说，可以使用pip install leidenalg直接安装。也可以使用源码进行安装，安装这个包需要C核心库igraph和python包python-igraph，然后可以通过python se
hive 开窗函数2022-06-12 16:00:16

-- 开窗------------------------分组排序--------------------------------- -- row_number() over(partition by ... order by ...) 组内的排名序号 1 2 3 4 5 6 7 -- rank() over(partition by userid order by pv desc) 组内的排名序号 1 2 3 3 5 6 6 8 -- dense_rank over
Sql Server系列：分区表操作2022-06-08 22:05:35

1. 分区表简介　　分区表在逻辑上是一个表，而物理上是多个表。从用户角度来看，分区表和普通表是一样的。使用分区表的主要目的是为改善大型表以及具有多个访问模式的表的可伸缩性和可管理性。　　分区表是把数据按设定的标准划分成区域存储在不同的文件组中，使用分区可以快速而有效
大数据技术之Hive 第7章分区表和分桶表（优化）2022-06-08 02:31:58

第7章分区表和分桶表（优化） 7.1 分区表分区表实际上就是对应一个HDFS文件系统上的独立的文件夹，该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句中的表达式选择查询所需要的指定的分区，这样的查询效
Partition和ReduceTask的关系2022-06-02 16:00:38

先看源码： numPartitions = conf.getNumReduceTasks(); if (numPartitions > 1) { //设置了ReduceTask个数后（大于1），默认通过下面的getPartition()对数据进行分区 partitioner = (Partitioner<K,V>) ReflectionUtils.newInstance(conf.g
Flink sink 到 kafka，并行度与分区的关系2022-06-01 14:33:51

Flink 版本： 1.15.0 问题在社区看到以下问题：请教个问题哈，sink 到 kafka，采用默认的分区器，是不是每个并行度都会与kafka的partition维护一个连接比如 10 个并行度，3个 partition，那么维护的连接数总共为 10*3 个  ？是的还是一个taskManager建立一个生产者一个生产者对应多个
MYSQL按天自动创建分区;创建之前的分区；2022-05-25 15:00:48

按天自动创建分区（创建当天日期后两天的）： CREATE DEFINER=`root`@`%` PROCEDURE `P_CREATE_PARTITION_BY_DAY`(IN_SCHEMANAME VARCHAR(64), IN_TABLENAME VARCHAR(64)) BEGIN #当前日期存在的分区的个数 DECLARE ROWS_CNT INT UNSIGNED; #目前日期，为当前日期的后一
【转】大数据开发之 Spark 面试八股文2022-05-24 14:32:47

【转】大数据开发之 Spark 面试八股文 1. Spark 的运行流程？具体运行流程如下： SparkContext 向资源管理器注册并向资源管理器申请运行 Executor 资源管理器分配 Executor，然后资源管理器启动 Executor Executor 发送心跳至资源管理器 SparkContext
Ubuntu16.0.4 加第二块扩展盘2022-05-21 19:03:11

写在前面，不建议在ubuntu 的vm的第一块盘上扩展磁盘容量，会丢数据。应新建一块磁盘查看当前硬盘 sudo fdisk -l 就可以看到目前的硬盘了。可以看到有块空的 sda(这里忘了复制输出了，大家可以看到自己的硬盘就对了)。新增硬盘，新建分区下面我们将使用 fdisk 命令来创建新的分区。
获取数组的前K小的元素2022-05-20 11:02:03

//升序排列 template <typename Comparable> int partition(vector<Comparable>& v, int left, int right) { if (left >= right) return left; int i = left, j = right; Comparable pivot = v[left]; while (i < j) { while (i &
kafka可靠传输、不重复消费、高可用2022-05-17 15:31:29

一. 如何保证消息的可靠传输数据丢失分两种：mq自身丢失数据；消费环节丢失数据 1、kafka自身丢失数据问题场景：kafka某个broker宕机，然后重新选举partiton的leader时解决方案： ① 给这个topic设置replication.factor参数：这个值必须大于1，要求每个partition必须有至少2个副本 ② 在k
Windows10换装1T容量M.2固态硬盘【已解决】2022-05-09 09:03:44

免责声明：以下操作有几率损坏数据，在操作前一定要做好数据备份！！！最近不知怎么弄的，硬盘一下子就爆满，200G的系统盘经常崩溃。于是趁着51活动，入手了一块Samsung的980，这块硬盘我在笔记本上也用过，性能还行，速度也够。机器配置：九代I9 + Z390 AORUS PRO WIFI + 32G海盗船 + 200G(M.2)
源码编译ProcessHacker2022-05-09 00:02:47

因为最新的使用v143编译工具链vs2019编译不通过，估计要用vs2022,不折腾编译环境了，所以源码选则最新tag processhacker 2.39源码编译报错处理1：错误error C2220: 警告被视为错误编译报错处理2：phlib\secdata.c 中找不到定义 MEMORY_PARTITION_ALL_ACCESS 从最新的源码里找到MEMORY_
SQL分区2022-05-07 17:33:50

---分区把一个表的数据按照字段的值，保存在多个区域，查询时，仅仅查询某一个或者多个区域，避免全表扫描。 --建表的时候，需要指定分区字段以及预制的分区。先要划好分区，才能插入数据。列表分区 ---不连续的，零散的字段的值，作为分区，常采用list列表类型 CREATE TABLE MYEMP2 ( EMPNO
5.快排（不稳定）2022-05-04 13:35:12

public static int Partition(int[] nums,int left,int right){ int prvot=nums[left]; while (left<right) { while (left<right&&nums[right]>=nums[left])right--; nums[left]=nums[right];
cf1667 B. Optimal Partition2022-05-03 12:00:06

题意：把数组分为任意子段。对每个子段，若子段和为正，则其价值为子段长度；若为负则为子段长度的相反数；若为0则价值为0。求最大价值总和。思路：若 \(a_i\le 0\)，那不如 \(a_i\) 自成一段，长度为 1。 dp。两种选择： \(dp(i)=dp(i-1)+ sgn(a_i)\) \(dp(i) = i + \max\limits _{s_i>s_j} \{-
Kafka 生产者源码2022-05-02 03:02:18

2.1 初始化 2.1.1 程序入口从用户自己编写的 main 方法开始阅读 package com.atguigu.kafka.producer; import org.apache.kafka.clients.producer.KafkaProducer; import org.apache.kafka.clients.producer.ProducerConfig; import org.apache.kafka.clients.producer.Prod
cf1631 D. Range and Partition2022-05-01 18:32:13

题意：给定长为 n 的数组。对一个值域区间 \([x,y]\)，若存在一种分法把原数组恰切成 k 段（subarray），每一段中大小在 \([x,y]\) 中的数都严格大于不在 \([x,y]\) 中的数，则称这个值域区间有效。找一个最短的值域区间并输出一种分段方案 \(1\le a_i\le n\) 思路：如果能切成 \(k+1\) 段，那
LeetCode 0086 Partition List2022-04-28 07:31:12

原题传送门 1. 题目描述 2. Solution 1 1、思路分析新建两个头结点，left存放小于x的结点，right存放大于等于x的结点值。从head遍历原始链表，结点值小于x挂left，大于等于x挂right，遍历结束后把right挂到left后面。 2、代码实现 package Q0099.Q0086PartitionList; import DataStructu

首页 < 1 2 3 4 5 6 7 8 > 尾页

ICode9

partition()、rpartition()2022-07-02 18:01:06

Hive-day06 Hive分区2022-06-30 09:00:42

Kubernetes——StatefulSet控制器资源的金丝雀部署2022-06-29 16:01:46

[LeetCode] 416. Partition Equal Subset Sum2022-06-28 14:34:15

Linux磁盘分区、格式化、挂载2022-06-27 22:06:47

虚拟机安装Arch Linux2022-06-26 21:31:17

leidenalg包教程-12022-06-18 01:00:37

hive 开窗函数2022-06-12 16:00:16

Sql Server系列：分区表操作2022-06-08 22:05:35

大数据技术之Hive 第7章 分区表和分桶表（优化）2022-06-08 02:31:58

Partition和ReduceTask的关系2022-06-02 16:00:38

Flink sink 到 kafka，并行度与分区的关系2022-06-01 14:33:51

MYSQL按天自动创建分区;创建之前的分区；2022-05-25 15:00:48

【转】大数据开发之 Spark 面试八股文2022-05-24 14:32:47

Ubuntu16.0.4 加第二块扩展盘2022-05-21 19:03:11

获取数组的前K小的元素2022-05-20 11:02:03

kafka可靠传输、不重复消费、高可用2022-05-17 15:31:29

Windows10换装1T容量M.2固态硬盘【已解决】2022-05-09 09:03:44

源码编译ProcessHacker2022-05-09 00:02:47

SQL分区2022-05-07 17:33:50

5.快排（不稳定）2022-05-04 13:35:12

cf1667 B. Optimal Partition2022-05-03 12:00:06

Kafka 生产者源码2022-05-02 03:02:18

cf1631 D. Range and Partition2022-05-01 18:32:13

LeetCode 0086 Partition List2022-04-28 07:31:12

大数据技术之Hive 第7章分区表和分桶表（优化）2022-06-08 02:31:58