配置单元-在DDL表创建中删除引号

时间:2018-07-18 09:40:43

标签: regex hive ddl

我有一个包含400列的CSV,其中一些值中包含“”。例如:

Field_A
"123"
""
"21111"

我的问题是:当我在Hive中创建表格以自动从数据中删除该引号时,是否可能?还是我需要在每个字段中添加regexp_replace()才能删除它?

谢谢!

1 个答案:

答案 0 :(得分:0)

我相信hortonworks的以下帖子可以回答您的问题。 https://community.hortonworks.com/questions/66603/how-to-remove-double-quote-from-csv-file-at-time-o.html

ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
   "separatorChar" = ",",
   "quoteChar"     = "\""
)