使用Column标头读取CSV并将其加载到hive表中

时间:2014-02-02 17:54:37

标签: hadoop mapreduce hive apache-pig cloudera

我的文件中包含列标题的csv文件。 e.g。

Column1 Column2 Column3
value1 value2 value 3
value1 value2 value 3
value1 value2 value 3
value1 value2 value 3

现在我想在里面使用这个头创建一个hive表,然后将没有标题行的整个表加载到表中。 任何人都可以建议在这种情况下应采取什么方法。

2 个答案:

答案 0 :(得分:0)

您可以指定

tblproperties ("skip.header.line.count"="1");

请参阅此问题(Hive External table-CSV File- Header row)

答案 1 :(得分:-1)

在将数据加载到HDFS之前,您应该删除标题行,此处没有其他选项。