一、概要 1、什么是流? 不可变的数据集,无限的没有边界。一旦产生不可修改和移除其中的元素,可以查看内部的元素,或者做转换。 2、datasource 3、datasink 4、Iterations 5、容错 6、控制延迟 二、执行模式 1、批处理,命令行设置 $ bin/flink run -Dexecution.runtime-mod
watermark 设置的方式 StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); DataStreamSource<Snapshot> dataStreamSource = env.addSource(new SourceFormClickhouse2()); // 设置watermark WatermarkStrategy<Snapsho
DataStream算子将一个或多个DataStream转换为新DataStream。程序可以将多个转换组合成复杂的数据流拓扑。 DataStreamAPI和DataSetAPI主要的区别在于Transformation部分。 DataStream Transformation map DataStream→DataStream 用一个数据元生成一个数据元。一个map函数,它将
DataStream算子将一个或多个DataStream转换为新DataStream。程序可以将多个转换组合成复杂的数据流拓扑。 DataStreamAPI和DataSetAPI主要的区别在于Transformation部分。 DataStream Transformation map DataStream→DataStream 用一个数据元生成一个数据元。一个map函数,它将