标签: sorting hadoop hdfs
我正在研究使用TotalOrderPartitioner在hadoop中进行总排序。问题是 TotalOrderPartitioner生成多个文件,我需要一个单独的排序文件。我查看了一些使用hadoop fs -cat output/part-r-*将所有文件合并在一起的示例。但是,我不确定是否保证cat每次都会以相同的顺序读取文件。是否有确定的方法将所有已排序的文件合并在一起以生成一个大的已排序文件?
hadoop fs -cat output/part-r-*
cat