Hive中的外部表来自两个镶木地板文件

时间:2017-06-19 21:03:04

标签: hive parquet external-tables

简而言之, 是否可以在具有不同模式的多个文件的顶部安装外部配置单元表,其中表是指定的那些文件中所有列的总数或其中的一部分?

我知道,问题有点复杂,请详细了解情景    下方。

我有两个镶木地板文件,在两个不同的位置有不同的架构,按yyyymmdd格式分区

/app/data/source/file-1/20170501/file-1.pqt
/app/data/source/file-2/20170501/file-2.pqt

我们假设文件一是这样的;目前,文件采用Parquet格式。

File-1
ID|Name
1|My Zone

File-2
APP ID, APP Name, APP owner
1,My App, Manager-1

我希望它安装在外部Hive表的顶部。 其中,当某个团体发出命令select * from table时,他会得到结果。

ID, Name, App Name, App Owner
1, My Zone, NULL, NULL
1, NULL, My APP, Manager-1

如果不可能,推荐的最佳方法是什么? 顺便说一下,请注意,这两个文件都是完全不同的源文件,而不是演进模式。

0 个答案:

没有答案