将部分列值加载到现有的镶木地板数据集

时间:2015-09-08 01:36:09

标签: hadoop mapreduce subset parquet

我需要将一组列值加载到现有的拼花数据集中。

当创建配置单元表从datawarehouse表中提取带有必填字段的数据时,会发生特定情况。

在某些分析中,需要将更多DW表中的列添加到hive表中。

因此我们只需添加要附加到现有数据集的特定列,而无需重新处理整个文件

0 个答案:

没有答案