HIVE 2.1.1表创建CSV-Serde

时间:2017-10-06 01:43:44

标签: hive double-quotes hive-serde

所以我做了所有的研究,在HIVE的任何地方都看不到同样的问题。

按照下面的链接,我对引号中的数据没有任何问题..

https://github.com/ogrodnek/csv-serde

我的外部表创建具有以下serde属性,但由于某种原因,默认的escapeChar('\')正在被quoteChar替换,而quoteChar是我的数据的双引号(“)。

CREATE EXTERNAL TABLE IF NOT EXISTS people_full(
`Unique ID` STRING,
.
.
.
.
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'  
WITH SERDEPROPERTIES (
   "escapeChar"    = "\\"
)  
STORED AS TEXTFILE

DATA ISSUE:

示例HDFS源数据:“\”Robs业务 目标HIVE输出:“”“抢夺业务

所以三个双引号如“”更新后的Robs业务所导致数据不需要的数据分隔(列是一个很长的字符串)可能是因为HIVE无法处理数据内部的三个双引号(quote(“))也是我的默认引号字符)?

为什么会发生这种情况并且有解决方案?请帮忙。非常感谢。

最佳, 阿沙

1 个答案:

答案 0 :(得分:0)

尝试使用Escaped它会起作用。请查看以下截图示例。 enter image description here