我已经从csv文件的AWS Athena中添加了一个表,该表使用特殊字符“æøå”。这些在输出中显示为``。 csv文件使用unicode编码。我也尝试过将编码更改为UTF-8,但是没有运气。 我已经在S3中上传了csv,然后使用以下DDL将表添加到了Athena:
CREATE EXTERNAL TABLE `regions_dk`(
`postnummer` string COMMENT 'from deserializer',
`kommuner` string COMMENT 'from deserializer',
`regioner` string COMMENT 'from deserializer')
ROW FORMAT SERDE
'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES (
'separatorChar'='\;')
STORED AS INPUTFORMAT
'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
's3://bucket/path'
TBLPROPERTIES (
'classification'='csv')
我还有另一个表,其中也包含字符“æøå”,这是我使用ETL脚本添加的,这里没有问题。
我俯瞰什么?