标签:watermark 处理 Flink 水位 时间 事件 算子
两个概念
处理时间:流处理算子所在机器的本地时间。
事件时间:数据流中事件发生的实际时间,一般是附加在数据流中事件的时间戳。
watermark -- 事件时间窗口的触发时机
实际生产中,事件不可避免会产生延迟,如何判断某一时间点之前的事件都已接收到,从而触发流处理算子工作?Flink提供了水位线机制,水位线就是告诉Flink,某个时间戳之前的事件都已全部到达。当算子接收到时间为T的水位线,算子就会认为不会再接收到时间戳小于或等于T的事件了。
- 水位线如果设置过小,可能会有延迟较久的事件未被处理,从而影响结果的准确性;需要额外代码来处理他们。
- 水位线如果设置过大,虽然准确性得到保证,但是延迟却变高了。
标签:watermark,处理,Flink,水位,时间,事件,算子 来源: https://www.cnblogs.com/route/p/15840556.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。