ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

Druid 加载 Kafka 流数据配置可以读取和处理的流中数据格式

2021-08-10 02:31:21  阅读:233  来源: 互联网

标签:protobuf inputFormat parser 流中 Druid Kafka 数据格式


Kafka 索引服务(indexing service)支持 inputFormat 和 parser 来指定特定的数据格式。

inputFormat 是一个较新的参数,针对使用的 Kafka 索引服务,我们建议你对这个数据格式参数字段进行设置。 不幸的是,目前还不能支持所有在老的 parser 中能够支持的数据格式(Druid 将会在后续的版本中提供支持)。

目前 inputFormat 能够支持的数据格式包括有: csv, delimited, json

如果你使用 parser 的话,你也可以阅读: avro_streamprotobufthrift 数据格式。

 

kafka-data-format-01

 

因为 Druid 的数据版本的更新,在老的环境下,如果使用 parser 能够处理更多的数格式。

如果通过配置文件来定义的话,在目前只能处理比较少的数据格式。

在我们的系统中,通常将数据格式定义为 JSON 格式,但是因为 JSON 的数据是不压缩的,通常会导致传输数据量增加很多。

 

protobuf

 

 

如果你想使用 protobuf 的数据格式的话,能够在 Kafka 中传递更多的内容,protobuf 是压缩的数据传输,占用网络带宽更小。

在小型系统中可能不一定会有太大的问题,但是对于大型系统来说,如果传输量小 80% 的话,那占用网络代码也会小很多,另外也能降低错误率。

 

https://www.ossez.com/t/druid-kafka/13666

标签:protobuf,inputFormat,parser,流中,Druid,Kafka,数据格式
来源: https://www.cnblogs.com/huyuchengus/p/15121874.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有