使用xpath快速提取值

时间:2016-02-09 12:16:57

标签: xpath

如果这听起来很原始,那就先跟我说吧。

基本上我希望能够从多个网页中的特定xpath中提取值。这些将是产品页面,它们都具有针对此特定xpath的值。

E.G

//*[@id="orb-modules"]/div[1]/section[3]/div/div[1]/a/div[2]/div/h2/span

我可以使用Chrome控制台和$ x命令找到该值(但是这会返回整个元素,而不仅仅是文本值)。

目标是在点击多个网页时快速选择并复制此值,而无需每次都在Chrome控制台中执行相同的命令。

任何想法都非常感激!

2 个答案:

答案 0 :(得分:0)

由于这是编程社区,我建议您使用Java + TagSoup库。在那里,您可以阅读网页,对它们执行xpath,在某处写入结果。

我还没准备好命名任何可以处理“狂野”HTML的命令行工具。

答案 1 :(得分:0)

您还可以使用此网址创建书签,任何标题:

javascript:alert(document.evaluate("//*[@id="orb-modules"]/div[1]/section[3]/div/div[1]/a/div[2]/div/h2/span", document, null, 0, null).iterateNext().textContent)

如果您尝试在相关页面上打开此书签,系统会提示您:)