我有一个包含400列的CSV,其中一些值中包含“”。例如:
Field_A
"123"
""
"21111"
我的问题是:当我在Hive中创建表格以自动从数据中删除该引号时,是否可能?还是我需要在每个字段中添加regexp_replace()
才能删除它?
谢谢!
答案 0 :(得分:0)
我相信hortonworks的以下帖子可以回答您的问题。 https://community.hortonworks.com/questions/66603/how-to-remove-double-quote-from-csv-file-at-time-o.html
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
"separatorChar" = ",",
"quoteChar" = "\""
)