拼写文件中的外部移位表显示了字符串数据类型的空值

时间:2018-09-19 03:44:43

标签: python amazon-redshift parquet pyarrow amazon-redshift-spectrum

我正在Redshift中创建一个外部表,指向存储在S3中的Parquet文件。实木复合地板文件是使用pyarrow创建的。当我SELECT *时,在“时间戳”下面定义的外部表起作用,但是“ anonymous_id”(VARCHAR)为空。这同样适用于任何VARCHAR。

CREATE EXTERNAL TABLE
propensity_identify  
(anonymous_id VARCHAR(max),
 timestamp timestamp without time zone)
PARTITIONED BY (loaded_at timestamp)
STORED AS PARQUET
LOCATION 's3://bucket/key'
TABLE PROPERTIES ('compression'='none', 'serialization.null.format'='')

实木复合地板架构为:

anonymousId: BYTE_ARRAY UTF8
timestamp: INT96

知道为什么会这样吗? STL_S3CLIENT_ERROR说:

S3ServiceException:HTTP/1.1 403 Forbidden,Status 403

非常感谢您的帮助!

0 个答案:

没有答案