我的MapReduce作业生成一个CSV文件并将其存储在HDFS中:
hdfs:///data/input/
在HDFS中生成两个文件:
/data/input/SUCCESS
/data/input/part-m-00000
如何在命令行/ shell脚本中将此CSV文件加载到HIVE表中?
答案 0 :(得分:0)
如果目录包含序列文件,HDFS + HCatalog会将目录视为单个文件。
你要问的最简单的方法就是简单地create an external table with the LOCATION specified,你使用的位置就是目录,而不是整个0000001(等)文件的路径