ICode9

精准搜索请尝试: 精确搜索
  • 10个常见触发IO瓶颈的高频业务场景2022-06-09 18:38:55

    摘要:本文从应用业务优化角度,以常见触发IO慢的业务SQL场景为例,指导如何通过优化业务去提升IO效率和降低IO。 本文分享自华为云社区《GaussDB(DWS)性能优化之业务降IO优化》,作者:along_2020。 IO高?业务慢?在DWS实际业务场景中因IO高、IO瓶颈导致的性能问题非常多,其中应用业务设计不合

  • Sql Server系列:分区表操作2022-06-08 22:05:35

    1. 分区表简介   分区表在逻辑上是一个表,而物理上是多个表。从用户角度来看,分区表和普通表是一样的。使用分区表的主要目的是为改善大型表以及具有多个访问模式的表的可伸缩性和可管理性。   分区表是把数据按设定的标准划分成区域存储在不同的文件组中,使用分区可以快速而有效

  • 新磁盘挂载与逻辑卷扩容2022-06-08 16:01:59

    一:磁盘分区   对于小于2T的磁盘:   1、ls /dev/sd*           --查看新增的磁盘 2、fdisk /dev/sdb  接着输入: 1、n               --新建 2、p               --增加一个主分区;编号从 1-4 3、1               --输入要

  • 大数据技术之Hive 第7章 分区表和分桶表(优化)2022-06-08 02:31:58

    第7章 分区表和分桶表(优化) 7.1 分区表 分区表实际上就是对应一个HDFS文件系统上的独立的文件夹,该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录,把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句中的表达式选择查询所需要的指定的分区,这样的查询效

  • spark大佬总结2022-06-07 21:05:01

    Spark概述 Hadoop小剧场 Hadoop1.x版本的问题 Hadoop2.x版本 Spark小剧场 为什么使用函数式编程 什么是Spark Spark是基于内存的快速、通用。可扩展的大数据分析引擎 Spark内置模块 模块分区 Spark SQL 结构化数据 | Spark Streaming 实时计算 Spark Core 独立调度器

  • 生产环境lvm、分区扩容2022-06-07 11:35:42

    1.3.2.1 db磁盘扩容1.3.2.1.1情况分析硬盘大小:500G数据大小:381G占用比例:76%文件系统挂载方式:lvm(逻辑卷)注:lvm只能新增独立硬盘,然后将新盘和旧盘合并,操作前建议先备份。1.3.2.1.2扩容方式这里无法给市级db服务器新增硬盘,先在本地环境演示,扩容的思路是一样的。(1)模拟添加新硬盘(2)下一步

  • 对Kafka中auto.offset.reset值的理解2022-06-06 13:32:41

    官网上对这个参数的解释比较宽泛,通过实验,对该参数加深了一些理解 auto.offset.reset有三个值:earlist, latest,none earliest:当创建消费者组时,消息中各分区下有已提交的offset时,从提交的offset开始消费;无提交的offset时,从头开始消费latest:当创建消费者组时,各分区下有已提交的offset时

  • ubuntu fdisk分区容量增加2022-06-06 10:03:59

     采用fdisk 进行主扩分区的磁盘进行扩容 2.vmware vsphere选择容量增加后,重启虚拟机 3.查看容量   lsblk   或df -h 4.fdisk   /dev/sda    进行分区, 5.查看分区,删除扩张分区, 如有提示删除表之类的不删除。(注意:删除扩张分区后不要选择保存更改) 6.重新分配扩张分区,可以保

  • 大数据技术之Kafka 第8章 Kafka面试题及答案2022-06-06 03:32:24

    第8章 Kafka面试题及答案 1. Kafka中的ISR、AR又代表什么? ISR:与leader保持同步的follower集合 AR:分区的所有副本 2. Kafka中的HW、LEO等分别代表什么? LEO:每个副本的最后条消息的offset HW:一个分区中所有副本最小的offset 3.Kafka中是怎么体现消息顺序性的? 每个分区内,每条消息都有

  • KAFKA 进阶:【十四】能否说一下 kafka 的负载均衡机制?2022-06-04 14:04:18

    大家好,这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验,希望对大家有所帮助,目录形式依旧为问答的方式,相当于是模拟面试。 一、概述 对于消息中间件来说,负载均衡是非常重要的,不能说我部署了 10 台机器,结果就 2 台忙的要死而其余 8 台都非常空闲,

  • KAFKA 进阶:【十三】能否说一下 kafka 分区数过多后存在哪些问题?2022-06-04 14:03:39

    大家好,这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验,希望对大家有所帮助,目录形式依旧为问答的方式,相当于是模拟面试。 一、概述 在对 kafka 有了基础的认知之后,回过头来看看,当前 kafka 的 存储架构 还存在哪些问题呢?很多地方有提到 kafka

  • KAFKA 实践:【二十】如何保证消息顺序?消息不丢失?消息不重复?2022-06-04 14:02:15

    大家好,这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验,希望对大家有所帮助,目录形式依旧为问答的方式,相当于是模拟面试。 前言 我们在前面几个文章,知道了 kafka 的生产者 / 消费者的基本原理,这里就让我们来思考一些常见的生产问题,例如标题中的那

  • 图文详解MapReduce工作机制2022-06-02 21:36:31

    job提交阶段 1、准备好待处理文本。 2、客户端submit()前,获取待处理数据的信息,然后根据参数配置,形成一个任务分配的规划。 3、客户端向Yarn请求创建MrAppMaster并提交切片等相关信息:job.split、wc.jar、job.xml。Yarn调用ResourceManager来创建MrAppMaster,而MrAppMaster则会根据

  • kafka+flink任务级顺序保证2022-06-02 17:35:21

    顺序保证难点 本文主要分析 CDC 业务场景中任务级顺序保证,技术选型为:debezium、kafka、flink,其构成了顺序保证中至关重要的每一环,应该充分考虑、分析各组件的对于顺序的支持。 首先 debezium 作为采集组件,其分别为 schema topic 和 data topic 提供了不同的时间字段,如下图 schema

  • Partition和ReduceTask的关系2022-06-02 16:00:38

    先看源码: numPartitions = conf.getNumReduceTasks(); if (numPartitions > 1) { //设置了ReduceTask个数后(大于1),默认通过下面的getPartition()对数据进行分区 partitioner = (Partitioner<K,V>) ReflectionUtils.newInstance(conf.g

  • KingbaseES interval 分区表介绍2022-06-02 09:35:19

    KingbaseES从V008R006C005B0041版本开始支持Oracle的Interval分区表功能。 Interval分区表是一种特殊的范围分区表。当执行INSERT或者UPDATE时,若数据超过所有现有范围分区时由数据库根据定义的间隔参数自动创建新的分区。 Interval分区只能指定一个分区键列,并且数据类型必须为NUMB

  • linux /etc/fstab 文件详细说明(转)2022-06-02 09:32:11

    版权声明:本文为CSDN博主「小龙王2010」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。 原文链接:https://blog.csdn.net/xiaolongwang2010/article/details/8657332   ———————————————— fstab这个文件描述系统中各种文件系统的信息,应用程序

  • Linux磁盘分区/格式化/挂载(树莓派3挂载硬盘)2022-06-01 17:06:19

    【前言】   本文将要讲解的功能为Linux环境下对磁盘进行操作。包括分区、格式化、挂载外接移动存储设备等。   该文的写作背景为本人的树莓派需要外接一个固态硬盘作为存储设备,因此,便开始了一系列的折腾。 【开发及部署环境】 开发环境:Raspberry Linux 部署环境:Rspberry Pi3

  • 全局索引与分区索引对于SQL性能影响的比较2022-06-01 14:02:29

    KingbaseES 提供了对于分区表 global index 的支持。global index 不仅提供了对于唯一索引功能的改进(无需包含分区键),而且在性能上相比非global index (local index)有很大的提升(无法提供分区条件情况下)。以下举例说明二者在性能方面的差异。 1、准备数据 create table t1(id1 integ

  • 转载-服务器内存少创建启动swap2022-06-01 00:33:17

    浏览器访问gitlab的web页面,发现非常慢,并且很容易出现502问题。其中一个原因就是8080端口被tomcat占用,前面一篇已经更换了端口,但还是很慢。后来搜了下,原因是gitlab占用内存太多,导致服务器崩溃。尤其是使用阿里云的服务器,最容易出现502.默认情况下,阿里云云主机的swap功能是没有启用

  • Mac2010年中折腾2022-05-30 11:34:12

    一台Mac2010年中(A1311),闲置好多年了,机械盘,双系统,很慢,食之无味弃之可惜,前些日子风控,孩子网课,拿来救急了,毕竟蓝牙、摄像头、麦克风等应有尽有,也可以说是神器了,除了卡顿。。。 瓶颈显而易见,就是机械盘,于是网上搜罗了格式教程,拆机!开干! 一段辛酸史就此开始 网购固态盘,吸盘,螺丝刀原来家中

  • Kafka2022-05-30 03:32:54

    Kafka简介 Apache Kafka 是一个开源分布式事件流平台,被数千家公司用于高性能数据管道、流分析、数据集成和任务关键型应用程序。 Kafka本质上是一个 MQ(Message Queue),使用消息队列的好处: 解耦:允许我们独立的扩展或修改队列两边的处理过程。 可恢复性:即使一个处理消息的进程挂掉,加

  • 归并排序C++实现2022-05-30 00:33:02

    思想: 先进行判断是否为一个元素数组; 取中间值进行分区(递归到分区键值为1) 每个分区的各个数据利用双指针进行比较大小,小者存到tmp数组暂存 处理分区剩下的值,直接存入tmp 将tmp暂存值导入到原数组中。 代码实现: #include<iostream> using namespace std; const int maxn = 10000

  • 关闭swap分区2022-05-29 17:03:28

    linux开机卡在swap,swap分区关闭后导致系统启动失败 https://blog.csdn.net/weixin_30122219/article/details/116995846 Centos7 对swap分区的使用 https://www.csdn.net/tags/OtTaYgysNDY5NjEtYmxvZwO0O0OO0O0O.html     swapoff -a vim /etc/sysctl.conf # 禁用swappi

  • 9.三种注册中心的异同点2022-05-29 17:01:19

    组件命 语言 CAP 服务健康检查 对外暴露接口 springcloid集成 Eureka java AP 可配支持 HTTP 已集成 Consul Go CP 支持 HTTP/DNS 已集成 zookeeper java CP 支持 客户端 已集成 CAP最多只能同时满足两个 CAP理论

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有