当我们在Hive中执行INSERT INTO命令时,执行结果会在HDFS中创建多个部分文件。
e.g。部分 - * - *****或000000_0,000001_0等或其他。
是否有控制这些零件文件命名的配置/设置?
我工作的集群创建000000_0,000001_0,000000_1等。我想将其更改为部分或文本等,以便我更容易选择这些文件并在需要时合并它们。
如果在执行HQL之前有可以在Hive中设置的设置,那将是理想的。
提前致谢。
答案 0 :(得分:0)
我认为你应该可以
set mapreduce.output.basename = part-;
这不起作用。我找到的唯一方法是使用自定义文件编写器。