适用于多行数据的AWS Spectrum vs Athena正确的JSON格式

时间:2019-11-21 14:52:20

标签: aws-glue amazon-athena amazon-redshift-spectrum

嘿,我正在尝试使用AWS Spectrum摄取/查询一些JSON数据。

我创建了一个json,其格式如下(每行一行):

{"name": "name1", "attr":"someval"},
{"name": "name2", "attr":"someval2"}

这不是有效的JSON格式,但是Glue AWS搜寻器会正确检测列。雅典娜(Athena)中的查询也可以运行,但是在Spectrum中我得到了无效的语法错误

Task failed due to an internal error. Error occured during Ion/JSON extractor match: IERR_INVALID_SYNTAX

我想知道如何将JSON数据(基本上是数组)转换成一种格式,以便AWS Glue Crawler将检测所有列,而Athena和Spectrum可以查询它。进行了一些尝试和错误,但是例如有效的JSON表示不能正确检测Glue和数据目录中的列:

[{"name": "name1", "attr":"someval"},
{"name": "name2", "attr":"someval2"}]

有什么建议吗?

0 个答案:

没有答案