HDFS中部分文件的命名约定

时间:2017-10-03 14:29:38

标签: hadoop hdfs

当我们在Hive中执行INSERT INTO命令时,执行结果会在HDFS中创建多个部分文件。

e.g。部分 - * - *****或000000_0,000001_0等或其他。

是否有控制这些零件文件命名的配置/设置?

我工作的集群创建000000_0,000001_0,000000_1等。我想将其更改为部分或文本等,以便我更容易选择这些文件并在需要时合并它们。

如果在执行HQL之前有可以在Hive中设置的设置,那将是理想的。

提前致谢。

1 个答案:

答案 0 :(得分:0)

我认为你应该可以

set mapreduce.output.basename = part-;

这不起作用。我找到的唯一方法是使用自定义文件编写器。