AWS Glue /数据目录显示数据引号

时间:2019-02-07 06:13:47

标签: amazon-web-services aws-glue

当我使用Athena从“数据目录”中查询文件时,所有数据都显示为用引号引起来。是否可以删除这些引号?

enter image description here

我尝试在表设置中添加quoteChar选项,但没有帮助

enter image description here

更新

根据要求,DDL:

CREATE EXTERNAL TABLE `holidays`(
  `id` bigint, 
  `start` string, 
  `end` string, 
  `createdat` string, 
  `updatedat` string, 
  `deletedat` string, 
  `type` string)
ROW FORMAT DELIMITED 
  FIELDS TERMINATED BY ',' 
WITH SERDEPROPERTIES ( 
  'quoteChar'='\"') 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  's3://pinfare-glue/holidays/'
TBLPROPERTIES (
  'CrawlerSchemaDeserializerVersion'='1.0', 
  'CrawlerSchemaSerializerVersion'='1.0', 
  'UPDATED_BY_CRAWLER'='pinfare-holidays', 
  'averageRecordSize'='84', 
  'classification'='csv', 
  'columnsOrdered'='true', 
  'compressionType'='none', 
  'delimiter'=',', 
  'objectCount'='1', 
  'recordCount'='29', 
  'sizeKey'='2494', 
  'skip.header.line.count'='1', 
  'typeOfData'='file')

1 个答案:

答案 0 :(得分:1)

我知道为时已晚,但我认为问题出在“Serde 序列化库”上 在

<块引用>

AWS GLUE --> 点击表格 --> 编辑表格 --> 勾选“Serde 序列化库” 它的值应该是“org.apache.hadoop.hive.serde2.OpenCSVSerde”

<块引用>

点击应用

这应该可以解决您的问题。以下是供您参考的示例图片。

<块引用>

enter image description here