标签: hdfs apache-flink
我有一个问题:我将排序后的数据(通过特定的键,例如时间戳)写入HDFS到多个文件中(每个文件约70GB,并对数据进行排序)。 我想通过Flink读取此文件。但是我必须确保对数据(跨文件)进行排序(排序)。
我的问题是:Flink如何从HDFS读取文件?它是按文件读取文件还是按每个文件的块随机读取文件?