通过Redshift频谱从S3查询嵌套的JSON文件(compressed-gzip)时,我遇到了错误
在离子/ JSON提取器匹配期间发生错误:IERR_INVALID_SYNTAX
很少有JSON格式错误。我们每小时都会从各种来源收到这些文件,无法纠正这些文件。
我在DDL中使用Serde org.openx.data.jsonserde.JsonSerDe
使用SERDEPROPERTIES-'ignore.malformed.json' = 'TRUE'
,Redshift仍然无法忽略文件中的语法问题。