标签:sender 生产者 kafka 内存 DQueue Kafka 数据
一、Kafka生产者 如何将消息发送到 kafka集群?
将下图纵向分为4列:
1)生产者的主线程
Producer对象:生成一个该对象,然后调用send方法
拦截器:不是必须的,可选
序列化器:kafka自己的更轻便,大部分都是数据,保证安全校验的只是小部分;而Java数据只占一小部分,大部分都是安全校验。因此在大数据的情况下,不能用Java自带的序列化功能。
分区器:这里的分区器,只是分recordAccumulator的区域,分到哪个DQueue
2)RecordAccumulator
该部分都在内存中,默认大小是32M
该部分有两个参数要注意 batch.size 和 linger.ms,具体含义见图。
这部分还有个内存池:
在生产者发送数据时,会从内存池拿内存用来储存数据;
待kafka集群成功接收到数据后,数据从DQueue删除释放内存,再归还给内存池
3)生产者的sender线程
sender线程会主动拉取数据。拉取数据的条件是batch.size 或 linger.ms,任何一个符合要求了就能拉取。
sender能容忍某个broker不返回应答的个数,是5。如果发了5个数据,都没有答复,那就不会再给该broker发送。
如果成功收到应答acks,就会清理掉DQueue里的数据;
如果发送不成功,会重试。该值默认设置的是Integer.MAX_VALUE
4)kafka集群
返回的应答种类,见图。
标签:sender,生产者,kafka,内存,DQueue,Kafka,数据 来源: https://www.cnblogs.com/frankcui/p/16065365.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。