aws glue中SerDeInfo的完整参数列表是什么?

时间:2018-01-16 07:23:08

标签: amazon-web-services aws-glue

Here是说明SerDeInfo参数的链接。他们将parameters定义为地图,但他们期望获得什么样的关键和价值?有一些例子:

"SerdeInfo": {
  "SerializationLibrary": "org.apache.hadoop.hive.serde2.OpenCSVSerde",
  "Parameters": {
    "field.delim": ",",
    "serialization.format": "1"
  }
},

但完整的清单是什么?

1 个答案:

答案 0 :(得分:0)

我认为您必须在Apache Hive文档中查找每种类型的Serializer / Deserializer的详细信息。例如。对于OpenCSVSerde:

https://hive.apache.org/javadocs/r2.1.1/api/org/apache/hadoop/hive/serde2/OpenCSVSerde.html

根据我对Java的基本了解,我认为您可以设置四个参数:

  • 日志
  • SEPARATORCHAR
  • QUOTECHAR
  • ESCAPECHAR

AWS docs for Athena中,有这个提示:

  

输入适当的分隔符,quoteChar和escapeChar值。分隔符值是逗号,quoteChar值是双引号(``),escapeChar值是反斜杠()。

因此,您似乎应该使用lowerCamelCase版的Java字段。尽管我从未见过Glue文档中记录了该约定。