我可以将包含标题的CSV文件加载到hive表中吗文件是否有动态列数?
例如;
我创建了外部表
CREATE EXTERNAL TABLE art_stat(art sting, rate1 string, rate2 string, prop1 string,prop2 string)
...
我有带头文件的CSV文件 File1(只有三个柱):
ART,RATE1,PROP2
apple,109,red
apple,90,green
grape,10,red
......
File2(只有道具columnth):
ART,PROP1,PROP2
candy,109,black
cooky,90,brown
grape,10,red
......
如何使用标准配置工具将这些文件加载到我的表中?
我有一个想法是创建bash脚本,它使用当前列创建临时表,然后将数据从临时表加载到目标表
有什么想法吗?
答案 0 :(得分:1)
我找到了决定。是否使用动态列的地图类型。
创建表art_data(art string, D map<string,string>)
。我制作了自定义SerDe库,将动态格式的csv文件传递给map
列的常量格式