当我使用Google Chrome的超酷元素检查器查找元素的XPath时,它会返回原始HTML中不存在的内容,例如<tbody>
。
显然,Chrome推断某些事情可以使页面呈现更顺畅;没关系。但我需要在Chrome之外的脚本中使用XPath。所以我通常会使用Chrome的XPath,然后使用反复试验直到XPath实际上在其他上下文中工作(在我的例子中,是用Python或Node.js编写的脚本)。
在给定网页中查找HTML元素的“原始”XPath有哪些更好的技术?
答案 0 :(得分:0)
不要使用完整的xpath。如果这样做,只要移动了一个元素,脚本就会中断。最好找到最简单的表达方式,为您提供所需的内容。例如,此页面的标题可能是://h1[@itemprop="name"]
,甚至只是//h1
。如果你的html解析器允许你使用css选择器,那就更好 - 尝试使用它们。