我在查询xml文档中的节点时遇到了一些困难。该文件是http://ods.od.nih.gov/api/index.aspx?resourcename=BotanicalBackground&readinglevel=Health%20Professional
我正在尝试获取第一个节点的文本。
我已经尝试过这些查询,但似乎都没有。
*[name()='ImageURL']
//captionedimage[1]
//Factsheet/RelatedImages/captionedimage[1]/ImageURL/text()
//RelatedImages/*[1]
非常感谢任何帮助。
答案 0 :(得分:1)
您最近的三个XPATH似乎正在运行(您可以在http://www.xpathtester.com/test或http://www.freeformatter.com/xpath-tester.html快速查看)。问题应该与您使用的环境相关联。
当我在scrapy上尝试它们时,上层XPATH没有检索到任何东西,只有//factsheet/relatedimages/captionedimage[1]/imageurl/text()
似乎正在工作。可悲的是,这种行为对我来说是令人惊讶的,我不知道它为什么这样做。但是你一定要尝试收集有关你正在使用的环境的更多信息。
答案 1 :(得分:0)
试试这个......
./ Factsheet / RelatedImages / [local-name()='captionedimage'和position()= 1] / [local-name()='ImageURL']