ICode9

精准搜索请尝试: 精确搜索
  • 大数据技术之Kafka 第1章 Kafka概述2022-06-06 02:31:06

    1.1 Kafka定义 Kafka是一个分布式的基于发布/订阅模式的消息队列(Message Queue),主要应用于大数据实时处理领域。 1.2 消息队列 1.2.1 传统消息队列的应用场景 使用消息队列的好处 1)解耦 允许你独立的扩展或修改两边的处理过程,只要确保它们遵守同样的接口约束。 2)可恢复性 系统的一

  • Pulsar解决的问题2022-06-04 22:32:29

    1.提供一个实时处理消息队列以及大规模数据流处理的平台 2.当前大多数的流处理平台,都无法简单的上云平台进行弹性伸缩扩展,比如Kafka,扩展node或者topic的分区,都要触发rebalance,rebalance期间是无法进行数据读写的。

  • KAFKA 入门:【六】能否深入聊一下 ISR 的伸缩过程?2022-06-04 14:04:54

    大家好,这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验,希望对大家有所帮助,目录形式依旧为问答的方式,相当于是模拟面试。 一、前言 可能有些朋友发现之前空缺了第六节,是因为之前写了没来得及完善就一直搁置了,因此在这儿后续补上。 二、概述 我

  • KAFKA 进阶:【十四】能否说一下 kafka 的负载均衡机制?2022-06-04 14:04:18

    大家好,这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验,希望对大家有所帮助,目录形式依旧为问答的方式,相当于是模拟面试。 一、概述 对于消息中间件来说,负载均衡是非常重要的,不能说我部署了 10 台机器,结果就 2 台忙的要死而其余 8 台都非常空闲,

  • KAFKA 进阶:【十三】能否说一下 kafka 分区数过多后存在哪些问题?2022-06-04 14:03:39

    大家好,这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验,希望对大家有所帮助,目录形式依旧为问答的方式,相当于是模拟面试。 一、概述 在对 kafka 有了基础的认知之后,回过头来看看,当前 kafka 的 存储架构 还存在哪些问题呢?很多地方有提到 kafka

  • KAFKA 进阶:【十六】能否说一下 kafka 中 zk 有哪些作用?2022-06-04 14:03:17

    大家好,这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验,希望对大家有所帮助,目录形式依旧为问答的方式,相当于是模拟面试。 一、概述 我们知道,在 2.8 版本之前,kafka 都是强依赖于 zk 的;哪怕是目前的 2.8 版本去 zk 也只是试用功能,官方也不推荐在

  • KAFKA 入门:【十七】说一说 kafka 的生产者客户端架构?2022-06-04 14:02:52

    大家好,这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验,希望对大家有所帮助,目录形式依旧为问答的方式,相当于是模拟面试。 什么是生产者的? 生产者的概念其实非常简单,一句话概括就是:负责生产消息发送到 kafka 的服务端。但是为什么要单独拎出来放

  • KAFKA 实践:【二十】如何保证消息顺序?消息不丢失?消息不重复?2022-06-04 14:02:15

    大家好,这是一个为了梦想而保持学习的博客。这个专题会记录我对于 KAFKA 的学习和实战经验,希望对大家有所帮助,目录形式依旧为问答的方式,相当于是模拟面试。 前言 我们在前面几个文章,知道了 kafka 的生产者 / 消费者的基本原理,这里就让我们来思考一些常见的生产问题,例如标题中的那

  • Kafka 主题解析2022-06-03 11:03:12

    一、主题管理 使⽤kafka-topics.sh脚本时可用的配置: 选项 说明 --config <String: name=value> 为创建的或修改的主题指定配置信息。⽀持下述配置条⽬:cleanup.policycompression.typedelete.retention.msfile.delete.delay.msflush.messagesflush.msfollower.replication.t

  • kafka+flink任务级顺序保证2022-06-02 17:35:21

    顺序保证难点 本文主要分析 CDC 业务场景中任务级顺序保证,技术选型为:debezium、kafka、flink,其构成了顺序保证中至关重要的每一环,应该充分考虑、分析各组件的对于顺序的支持。 首先 debezium 作为采集组件,其分别为 schema topic 和 data topic 提供了不同的时间字段,如下图 schema

  • flink+kafka的端到端一致性2022-06-02 17:33:55

    上一篇中提到flink+kafka如何做到任务级顺序保证,而端到端一致性即为实现用户数据目标端与源端的准确一致,当源端数据发生更改时,保证目标端及时、正确、持久的写入更改数据。为实现端到端一致性应在顺序保证的基础上,实现一致性语义exactly once的保证。纵观各底层组件:Debezium、Kafk

  • Kafka的安装2022-06-02 14:03:18

    安装sbt 1.下载并解压至/usr/local    赋予权限并将bin目录下的sbt-launch.jar复制到sbt        安装目录下创建shell脚本文件,启动sbt     增加可执行权限,并查看sbt版本信息      Kafka的安装 解压至/usr/local,改名为kafka并赋予权限     打开终端,启动Zookeeper

  • Apache Pulsar 与 Apache Kafka 2022 基准测试2022-05-30 15:32:01

    我们很高兴分享 Apache Pulsar 与 Apache Kafka 2022 基准测试。 由 StreamNative CTO、Pulsar PMC 主席 Matteo Merli 领导,李鹏辉,Apache Pulsar PMC,担任工程主管的工程团队使用 Linux Foundation Open Messaging 基准进行了基准研究。 该团队在吞吐量和延迟方面测量了 Pulsar 的

  • Kafka到底有多高可靠?(RNG NB)2022-05-30 09:03:13

    在聊Kafka高可靠之前,先在评论区来波RNG NB好不好! 什么叫可靠性? 大家都知道,系统架构有三高:「高性能、高并发和高可用」,三者的重要性不言而喻。 对于任意系统,想要同时满足三高都是一件非常困难的事情,大型业务系统或者传统中间件都会搭建复杂的架构来保证。 除以上三种模式之外,还有一

  • Kafka2022-05-30 03:32:54

    Kafka简介 Apache Kafka 是一个开源分布式事件流平台,被数千家公司用于高性能数据管道、流分析、数据集成和任务关键型应用程序。 Kafka本质上是一个 MQ(Message Queue),使用消息队列的好处: 解耦:允许我们独立的扩展或修改队列两边的处理过程。 可恢复性:即使一个处理消息的进程挂掉,加

  • Kakfa Kraft模式部署2022-05-30 02:00:07

    下载包 官网https://www.apache.org/dyn/closer.cgi?path=/kafka/3.2.0/kafka_2.12-3.2.0.tgz 解压 tar -xzf kafka_2.13-3.2.0.tgz cd kafka_2.13-3.2.0 可以查看config/kraft/README.md了解一下 生成集群ID bin/kafka-storage.sh random-uuid > uuid cat uuid 单机版部署 修

  • Kafka 消费者解析2022-05-28 19:31:44

    一、消费者相关概念 1.1 消费组&消费者 消费者: 消费者从订阅的主题消费消息,消费消息的偏移量保存在Kafka的名字是__consumer_offsets的主题中 消费者还可以将⾃⼰的偏移量存储到Zookeeper,需要设置offset.storage=zookeeper 推荐使⽤Kafka存储消费者的偏移量。因为Zookeeper不适合

  • Kafka - 生产调优 之 硬件配置选择2022-05-27 23:31:44

    一、峰值计算     二、购买多少服务器     三、磁盘选择     四、内存选择     kafka的内存 = 堆内存(kafka内部配置)+ 页内存(服务器内存)       如果生产环境数据量很大,可以设置为10G-15G     查看kafka GC情况 YGC,年轻代GC次数,这里是36次可以接受     查看

  • 启动HDFS, Zookeeper,Kafka,hbase2022-05-26 15:32:54

    启动HDFS,start-all.sh           启动Zookeeper,myzk.sh start /opt/zookeeper-3.4.10/bin/zkServer.sh $1         启动Kafka,mykafka.sh start /opt/kafka_2.11-2.4.1/bin/kafka-server-start.sh -daemon /opt/kafka_2.11-2.4.1/config/server.properties    

  • kafka使用场景案例2022-05-26 15:00:07

    借鉴博客:https://blog.csdn.net/qq_40454136/article/details/121097161     大概描述一下kafka在项目中的使用场景。   kafka是消息中间件的一种,那到底在项目中用它干嘛呢?   消息中间件那肯定跟消息的处理有关,以下有几个使用场景:     其实它就是为了解决一些高并发的场

  • 大数据Hadoop之——Kafka 图形化工具 EFAK(EFAK环境部署)2022-05-26 00:31:42

    目录一、概述二、EFAK架构三、EFAK数据采集原理四、安装Kafka1)Kafka下载2)配置环境变量3)创建logs目录4)修改kafka配置5)修改zookeeper配置6)配置Zookeeper myid7)开启Kafka JMX监控8)将kafka目录推送到其它节点9)启动服务五、安装EFAK1)下载EFAK2)创建数据库2)设置环境变量3)配置4)调整启动参

  • 【搬运】kafka相关2022-05-24 13:33:46

    原文地址【侵删】:https://blog.51cto.com/fengyuzaitu/2496201   以下为搬运内容:   1)环境软件版本2.0.0        Released July 30, 2018        Release Notes        Source download: kafka-2.0.0-src.tgz (asc, sha512)        Binary downloads

  • 【kafka】生产者和消费者代码2022-05-24 13:32:55

      Producer static void Main(string[] args) { Console.WriteLine("请输入消息内容"); using (var producer = new KafkaProducer()) { while (true) { string messag

  • 如何为微服务选择正确的消息队列2022-05-24 07:31:55

    微服务及消息队列简史 自从 Peter Rodgers 博士 2005 年在 Web Services Edge 会议上首次提出 Micro-Web-Services 一词后,IT 行业慢慢地从单体架构转向了微服务。 2009 年,Netflix 决定把其单体架构拆分为微服务。 2010 年,Best Buy 开始把它们的单体架构转变为微服务

  • kafka核心知识简略版整理2022-05-23 13:02:59

    1.是什么? Kafka是一个分布式、支持分区、多副本的,基于zookeeper协调的分布式消息中间件 2 使用场景 核心的场景、原因有 3 个:解耦、异步、削峰。 具体: 日志收集 消息系统:解耦和生产者和消费者、缓存消息等。 用户活动跟踪:用户的各种活动,如浏览、搜索、点击等活动,发布到kafka的top

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有