我在Amazon Athena中提供了一个表,其中一列包含XML数据。可能这不是最好的方法,但我需要使用我的工作。
从我读到的内容来看,没有本机支持从这些XML中提取数据(比如使用XPATH等)。有没有办法组合一个查询,以便解析XML并提取存储在其中的一些数据?
答案 0 :(得分:0)
您可以尝试使用https://xmlconverter.sonra.io/中的Flexter工具将列转换为TSV文件,并在文本文件上使用Athena查询。
答案 1 :(得分:0)
我制作了这个npm cli以使用管道构建json
https://www.npmjs.com/package/@gbalbuena/xmltojson-cli
一旦获得可以使用jq提取和转换的json