如何提取存储在亚马逊雅典娜中的XML数据?

时间:2018-04-06 13:43:05

标签: amazon-athena

我在Amazon Athena中提供了一个表,其中一列包含XML数据。可能这不是最好的方法,但我需要使用我的工作。

从我读到的内容来看,没有本机支持从这些XML中提取数据(比如使用XPATH等)。有没有办法组合一个查询,以便解析XML并提取存储在其中的一些数据?

2 个答案:

答案 0 :(得分:0)

您可以尝试使用https://xmlconverter.sonra.io/中的Flexter工具将列转换为TSV文件,并在文本文件上使用Athena查询。

答案 1 :(得分:0)

我制作了这个npm cli以使用管道构建json

https://www.npmjs.com/package/@gbalbuena/xmltojson-cli

一旦获得可以使用jq提取和转换的json