使用csv-serde时自动选择定界符

时间:2018-07-02 12:49:28

标签: hadoop hive hiveql hive-serde

使用以下方法创建了一个表

 )   
ROW FORMAT SERDE 'com.bizo.hive.serde.csv.CSVSerde'
with serdeproperties(
"field.delim"="|"
)   

当我尝试以逗号分隔的文件上传时,它已正确上传。如果我已将管道配置为数据的分隔符,那怎么可能? csv-Serde是否具有识别分隔符的“智能”方式?

1 个答案:

答案 0 :(得分:0)

根据documentation,有效的CSVSerde属性为

   "separatorChar" = "\t",
   "quoteChar"     = "'",
   "escapeChar"    = "\\"

默认分隔符,引号和转义符(如果未指定)

DEFAULT_ESCAPE_CHARACTER \
DEFAULT_QUOTE_CHARACTER  "
DEFAULT_SEPARATOR        ,

field.delim是不受支持的属性,将被忽略,它使用默认设置。 此属性对另一个SerDe MultiDelimitSerDe

有效