我正在将csv文件导出到hive表中。 关于csv文件:列值用双引号括起来,用逗号分隔。
来自csv的样本记录
"4","good"
"3","not bad"
"1","very worst"
我使用以下语句创建了一个hive表,
创建由','
分隔的外部表格currys(review_rating字符串,review_comment字符串)行格式字段;
已创建表格。
现在我使用命令load data local inpath加载数据并且它成功了。 当我查询表时,
select * from currys;
结果是:
"4" "good"
"3" "not bad"
"1" "very worst"
而不是
4 good
3 not bad
1 very worst
记录插入双引号,但不应该。
请让我知道如何摆脱这个双引号..任何帮助或指导都非常感谢...
事先谢谢!
答案 0 :(得分:7)
您使用的是serde
吗?如果是,那么您可以在regex
中编写SERDE PROPERTIES
命令以删除引号。
或者您可以使用here中的csv-serde
并定义quote character
。