如何从Chrome检查器获取原始XPath?

时间:2013-03-02 06:29:27

标签: google-chrome xpath screen-scraping

当我使用Google Chrome的超酷元素检查器查找元素的XPath时,它会返回原始HTML中不存在的内容,例如<tbody>

显然,Chrome推断某些事情可以使页面呈现更顺畅;没关系。但我需要在Chrome之外的脚本中使用XPath。所以我通常会使用Chrome的XPath,然后使用反复试验直到XPath实际上在其他上下文中工作(在我的例子中,是用Python或Node.js编写的脚本)。

在给定网页中查找HTML元素的“原始”XPath有哪些更好的技术?

1 个答案:

答案 0 :(得分:0)

不要使用完整的xpath。如果这样做,只要移动了一个元素,脚本就会中断。最好找到最简单的表达方式,为您提供所需的内容。例如,此页面的标题可能是://h1[@itemprop="name"],甚至只是//h1。如果你的html解析器允许你使用css选择器,那就更好 - 尝试使用它们。