简而言之, 是否可以在具有不同模式的多个文件的顶部安装外部配置单元表,其中表是指定的那些文件中所有列的总数或其中的一部分?
我知道,问题有点复杂,请详细了解情景 下方。
我有两个镶木地板文件,在两个不同的位置有不同的架构,按yyyymmdd
格式分区
/app/data/source/file-1/20170501/file-1.pqt
/app/data/source/file-2/20170501/file-2.pqt
我们假设文件一是这样的;目前,文件采用Parquet格式。
File-1
ID|Name
1|My Zone
File-2
APP ID, APP Name, APP owner
1,My App, Manager-1
我希望它安装在外部Hive表的顶部。 其中,当某个团体发出命令select * from table时,他会得到结果。
ID, Name, App Name, App Owner
1, My Zone, NULL, NULL
1, NULL, My APP, Manager-1
如果不可能,推荐的最佳方法是什么? 顺便说一下,请注意,这两个文件都是完全不同的源文件,而不是演进模式。