google-chrome - 如何从Chrome检查器获取原始XPath？

时间：2013-03-02 06:29:27

标签： google-chrome xpath screen-scraping

当我使用Google Chrome的超酷元素检查器查找元素的XPath时，它会返回原始HTML中不存在的内容，例如<tbody>。

显然，Chrome推断某些事情可以使页面呈现更顺畅;没关系。但我需要在Chrome之外的脚本中使用XPath。所以我通常会使用Chrome的XPath，然后使用反复试验直到XPath实际上在其他上下文中工作（在我的例子中，是用Python或Node.js编写的脚本）。

在给定网页中查找HTML元素的“原始”XPath有哪些更好的技术？

答案 0 :(得分：0)

不要使用完整的xpath。如果这样做，只要移动了一个元素，脚本就会中断。最好找到最简单的表达方式，为您提供所需的内容。例如，此页面的标题可能是：//h1[@itemprop="name"]，甚至只是//h1。如果你的html解析器允许你使用css选择器，那就更好 - 尝试使用它们。