ICode9

精准搜索请尝试: 精确搜索
  • Spark Streaming实时写入Hive当日分区2022-07-17 17:13:09

    背景 由于需要查看原始数据,而原始数据实时产生,数据量较大,大约1万/分钟,写入MDB占用MDB的流量带宽,故考虑将原始数据写入Hive   逻辑 Spark Streaming作业中将消费的RDD整体处理为一个临时表,然后insert into到Hive表当日分区,即追加到当日分区   现状 写入少部分数据后就没有新数据

  • 基于顺序搜索的动态分区分配算法2022-07-17 12:00:19

    基于顺序搜索的动态分区分配算法 实现动态分区分配,通常是将系统中的空闲分区链接成一个链。顺序搜索是指依次搜索空闲分区链上的空闲分区,去寻找一个其大小能满足要求的分区,适用于不太大的系统。 首次适应(first fit,FF)算法:从链首开始顺序查找,直至找到一个大小能满足要求的空闲分区

  • centos关闭swap分区2022-07-17 09:34:22

    第一步 关闭swap分区:swapoff -a第二步修改配置文件 - /etc/fstab删除swap相关行 /mnt/swap swap swap defaults 0 0 这一行或者注释掉这一行 第三步确认swap已经关闭free -m  若swap行都显示 0 则表示关闭成功 第四步调整 swappiness 参数echo 0 > /proc/sys/vm/swappiness # 临

  • linux 格式化u盘2022-07-15 18:31:11

    fdisk -l  检查U盘的设备名 fdisk /dev/xxxxx 输入p 输入d 分别删掉所有分区 输入n 创建分区,(创建两个默认分区) 输入w 退出分区操作 mkfs -V -t vfat /dev/sdb1   格式化成vfat文件系统,以便Windows环境也可识别   参考 https://blog.51cto.com/u_2982693/3358904 https://blo

  • kafka分区详解2022-07-12 20:35:30

    what:   Kafka可以将主题划分为多个分区(Partition),会根据分区规则选择把消息存储到哪个具体分区中。   如果分区规则设置的合理,那么所有的消息将会被均匀的分布到不同的分区中,这样就实现了负载均衡 和水平扩展。   多个订阅者可以从一个或者多个分区中同时消费数据,以支撑海量

  • Spark-RDD,算子2022-07-12 09:04:15

    Spark内核 RDD ResilientDistributedDataset (弹性分布式数据集 ) 五大特性: A list of partitions A function for computing each split A list of dependencies on other RDDs Optionally, a Partitioner for key-value RDDs Optionally, a list of preferred locations to comp

  • Microsoft OneNote 教程,如何在 OneNote 中创建更多空间?2022-07-11 11:35:10

    欢迎观看 Microsoft OneNote 中文版教程,小编带大家学习 OneNote 的使用技巧,了解如何在 Microsoft OneNote 中创建更多空间。 可以使用 OneNote 创建所需数量的页、分区和笔记本。 添加页面,选择「显示导航」。 然后选择「添加页面」,为此页键入有意义的标题。 若要保持页井然有序,

  • Kafka - 01简介2022-07-10 11:05:29

    Kafka - 01简介 Kafka是最初由Linkedin公司开发,是一个分布式、支持分区(partition)、多副本(replica),基于zookeeper协调的分布式消息系统; 最大的特性是可以实时处理大量数据以满足各种需求场景,如基于hadoop的批处理系统、低延迟的实时系统、Storm/Spark流式处理引擎、web/nginx日志、

  • VirtualBox中的Ubuntu22.04扩大存储空间2022-07-10 01:00:46

    先扩大.vdi文件       VitualBox已经识别到扩大的存储空间。     查看fdisk,可以看到总共90G,但是只有9.5G能用   但是Ubuntu系统还不能够识别扩大的存储空间,需要使用分区拓展工具辅助识别  sudo apt-get install gparted安装软件进行手动分区 应用分区的设定OK. 最后df

  • Grasscutter建立独立分区教程2022-07-10 00:00:57

    本文内容均为原创,意在学习交流,请勿用于非法用途,切记切记! 关于如何调出客户端的选服界面 打开 config.json 拖到最后,找到 "dispatch": {     "regions": [],     "defaultName": "Grasscutter" } 进行如下修改 "dispatch": {     "regions": [         {

  • OS总复习2022-07-09 13:04:08

    第一章 问答题 什么是OS 地位一计算机系统硬件之上的第一层软件,是一切用户使用计算机硬件的接口,是构成计算机系统的核心。 作用一管理计算机系统资源,提供多用户使用计算机资源的途径和方式。 1.开发使用OS的目的 操作系统统一的控制和管理计算机所拥有的硬件和软件资源,使之可以得

  • 4种Kafka网络中断和网络分区场景分析2022-07-08 15:04:19

    摘要:本文主要带来4种Kafka网络中断和网络分区场景分析。 本文分享自华为云社区《Kafka网络中断和网络分区场景分析》,作者: 中间件小哥。 以Kafka 2.7.1版本为例,依赖zk方式部署 3个broker分布在3个az,3个zk(和broker合部),单分区3副本 1. 单个broker节点和leader节点网络中断 网络中断

  • 【Spark】spark.sql.sources.partitionOverwriteMode2022-07-07 18:34:07

    参考:(80条消息) spark优化之分区插入_大怀特的博客-CSDN博客_spark插入   // 覆盖指定分区table("tv_group").write.option("partitionOverwriteMode", "dynamic").partitionBy("store_id", "group_id"). mode(SaveMode.Overwrite).save("x

  • Linux挂载硬盘(容量大于2T)2022-07-06 19:02:56

    目标: 1、Linux将16T的硬盘挂载到指定的目录下 2、Linux将16T的硬盘分区,分别挂载到不同的两个不同的目录下 准备知识: 1、Linux将所有的设备抽象为一个文件,保存在/dev文件夹下。设备名称一般为 hd[a-z]或sd[a-z]([a-z]为分区号),hda一般是指IDE接口的硬盘,sda一般是指SATA接口的硬盘,如:hd

  • 记一次出题经历——磁盘取证2022-07-06 08:35:57

    出这个主要涉及的就是取证部分和分析部分,分析部分自然不用说,多搞点知识点套个娃就行( 主要是取证部分,昨天在制作虚拟磁盘镜像这块卡了好久,一开始用的是AccessData FTK Imager,后来发现效果似乎没有达到预期。又改用DiskGenius搞了好久才制作成功。接下来就讲讲怎么制作一个虚拟磁

  • oracle的分区操作2022-07-05 22:32:31

    删除分区后,索引会失效;所有需要重建索引操作,需要以下步骤: 方法一:   1、删除分区     ALTER TABLE 表名 DROP PARTITION 分区名   2、重建索引     alter index 索引名称 rebuild online; 方法二:    删除分区并更新索引(drop 一个分区表的某个分区会导致该分区表上的

  • 新型MPP的Doris数据库:数据模型和数据分区使用详解2022-07-05 14:36:42

    Apache Doris是一个现代化的MPP分析性数据库产品。是一个由百度开源,在2018年贡献给Apache基金会,成为有顶级开源项目。仅需要亚秒级响应时间即可获得查询结果,可以有效地支持实时数据分析。Apache Doris可以满足多种数据分析需求,如数仓T+1模式固定历史报表,实时数据分析等。 数据模型

  • Centos7(非LVM)扩容根目录2022-07-04 17:33:35

     Centos7(非LVM)扩容根目录 系统安装在了VM上,so首先对虚拟机进行扩容: 1、进入VM,选择“虚拟机——>设置” 2、选择硬盘,看到扩展为置灰状态(看提示信息,发现有快照的,不能扩容) 3、到快照管理中直接删除所有的快照,重新回到设置中,进入扩展磁盘容量中,输入磁盘大小,确定 linux系统不会自动识

  • Spark快速上手(4)Spark核心编程-Spark分区器(Partitioner)@(RDD-K_V)2022-07-04 17:31:08

    @Spark分区器(Partitioner) HashPartitioner(默认的分区器) HashPartitioner分区原理是对于给定的key,计算其hashCode,并除以分区的个数取余,如果余数小于0,则余数+分区的个数,最后返回的值就是这个key所属的分区ID,当key为null值是返回0。 源码在org.apache.spark包下: origin code: class

  • MPSoC QSPI Flash 升级办法2022-07-04 10:05:37

    启动分区 在系统设计时,在PetaLinux工程里,为boot.bin预留多个启动分区。使用命令cat /proc/mtd或者ls /dev/mtd*,看得到多个分区。 传输新版本boot.bin 通过网络或者其它方式,把新版本boot.bin传输到单板的Linux文件系统。 写新版本boot.bin到QSPI Flash启动分区 使用flashcp 把新版

  • Linux 磁盘挂载和swap空间管理2022-07-02 15:35:48

    挂载:把指定的设备和根下面的某个文件夹建立关联 卸载:解除两者关系的过程 挂载文件系统:mount 格式:mount device mountpoint --- mount 设备名 挂载点 mountpoint:挂载点目录必须事先存在,建议使用空目录 选项: -t fstype:指定文件系统类型,比如ext4 -r readonly,只读挂载 -w read

  • Flink 物理分区2022-07-01 19:03:01

      分区是要将数据进行重新分布,传递到不同的流分区。keyBy 操作实际是一种按照hashCode 值进行重新分区的操作,这也是一种逻辑分区(按照散列值随机分开)。简单的说,分区就是slot 任务,重分区就是分配任务到不同的slot。   系统默认也有分区,比如:我们编写的程序可能对多个处理任务

  • Linux MBR和GPT分区类型2022-06-30 20:35:17

    磁盘分区的好处: 优化IO性能、实现磁盘配额、隔离系统和程序、可以采用多个文件系统 分区的方式: MBR --- 比较传统的分区 GPT MBR分区: MBR:Master Boot Record(主引导记录),1982年开发而来,使用32位表示扇区数,分区不超过2T 特点:支持的分区空间有限 0磁道0扇区: MBR的分区是按照分区

  • 数据库 OLAP、OLTP是什么?相同和不同?适用场景2022-06-30 20:03:44

    一、OLTP和OLAP是什么,二者比较 人类世界遵从基本的物理规律,数据世界里,关于数据的操作处理,也大体分为OLTP和OLAP两类。 OLTP on-line transaction processing 联机事物处理                  以传统RDBMS关系型数据库为主要应用,用于基本的、日常的事务处理,例如银行交易 OL

  • Hive-day06 Hive分区2022-06-30 09:00:42

    Hive分区 在大数据中,最常见的一种思想就是分治,我们可以把大的文件切割划分成一个个的小的文件,这样每次操作一个个小的文件就会很容易了,同样的道理,在hive当中也是支持这种思想的,就是我们可以把大的数据,按照每天或者每小时切分成一个个小的文件,这样去操作小的文件就会容易很多了。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有