AWS Athena中的特殊字符显示为问号

时间:2018-08-10 09:24:32

标签: sql amazon-web-services ddl amazon-athena presto

我已经从csv文件的AWS Athena中添加了一个表,该表使用特殊字符“æøå”。这些在输出中显示为``。 csv文件使用unicode编码。我也尝试过将编码更改为UTF-8,但是没有运气。 我已经在S3中上传了csv,然后使用以下DDL将表添加到了Athena:

CREATE EXTERNAL TABLE `regions_dk`(
  `postnummer` string COMMENT 'from deserializer', 
  `kommuner` string COMMENT 'from deserializer', 
  `regioner` string COMMENT 'from deserializer')
ROW FORMAT SERDE 
  'org.apache.hadoop.hive.serde2.OpenCSVSerde' 
WITH SERDEPROPERTIES ( 
  'separatorChar'='\;') 
STORED AS INPUTFORMAT 
  'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  's3://bucket/path'
TBLPROPERTIES (
  'classification'='csv')

我还有另一个表,其中也包含字符“æøå”,这是我使用ETL脚本添加的,这里没有问题。

我俯瞰什么?

0 个答案:

没有答案