我需要使用flink分割数据流。
名为“myDs”的第一个 - 包含重复数据
名为“goodDataStream”的第二个应该过滤重复项
部分代码是:
goodDataStream = myDs
.filter( new DedupeFilterFunction()) // does this line affects myDs also?
// createSync for goodDataStream
// createSync for myDs
我的问题是:
这是否意味着myDs sync还包含新的DedupeFilterFunction()
感谢。
答案 0 :(得分:2)
DataStream
是不可变的。因此,在您的情况下,myDs
将不会应用DedupeFilterFunction
。