Flink如何在引擎盖下从HDFS读取多个文件?

时间:2018-10-24 09:41:17

标签: hdfs apache-flink

我有一个问题:我将排序后的数据(通过特定的键,例如时间戳)写入HDFS到多个文件中(每个文件约70GB,并对数据进行排序)。 我想通过Flink读取此文件。但是我必须确保对数据(跨文件)进行排序(排序)。

我的问题是:Flink如何从HDFS读取文件?它是按文件读取文件还是按每个文件的块随机读取文件?

0 个答案:

没有答案