应用错误收集

Flink如何在引擎盖下从HDFS读取多个文件？

时间：2018-10-24 09:41:17

标签： hdfs apache-flink

我有一个问题：我将排序后的数据（通过特定的键，例如时间戳）写入HDFS到多个文件中（每个文件约70GB，并对数据进行排序）。我想通过Flink读取此文件。但是我必须确保对数据（跨文件）进行排序（排序）。

我的问题是：Flink如何从HDFS读取文件？它是按文件读取文件还是按每个文件的块随机读取文件？

0 个答案:

没有答案