所以我做了所有的研究,在HIVE的任何地方都看不到同样的问题。
按照下面的链接,我对引号中的数据没有任何问题..
https://github.com/ogrodnek/csv-serde
我的外部表创建具有以下serde属性,但由于某种原因,默认的escapeChar('\')正在被quoteChar替换,而quoteChar是我的数据的双引号(“)。
CREATE EXTERNAL TABLE IF NOT EXISTS people_full(
`Unique ID` STRING,
.
.
.
.
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
"escapeChar" = "\\"
)
STORED AS TEXTFILE
DATA ISSUE:
示例HDFS源数据:“\”Robs业务 目标HIVE输出:“”“抢夺业务
所以三个双引号如“”更新后的Robs业务所导致数据不需要的数据分隔(列是一个很长的字符串)可能是因为HIVE无法处理数据内部的三个双引号(quote(“))也是我的默认引号字符)?
为什么会发生这种情况并且有解决方案?请帮忙。非常感谢。
最佳, 阿沙