如何将分区数据重新加载到ORC中

时间:2015-05-06 22:03:25

标签: hive yarn hdinsight

是否有使用分区将数据加载到ORC的最佳做法。如果我将120 GB的数据加载到ORC分区表中。分区在2列上。如果想为特定分区重新加载数据如何重新加载活动。如何删除分区,是否更改表删除分区(分区值)。即使删除分区后,我仍然在Hive / WareHouse文件夹中看到ORC分区文件。如何清理未分区的文件。如果我只想将单个分区数据加载到删除分区,如何执行以及什么是最佳方式。

ORC与分区与Bucket可以提供比ORC更好的性能与分区,然后ORC(没有分区)

1 个答案:

答案 0 :(得分:0)

删除表或分区只会删除元数据信息,但不一定会删除外部表的数据。您应该使用TRUNCATE删除外部表或分区中的数据。阅读更多here