解析网站时依赖于发生索引或关键字是否更可靠?

时间:2016-10-13 12:55:23

标签: python xpath lxml

刚开始使用XPath,我正在使用lxml解析一个网站。

最好是这样做:

number_I_want = parsed_body.xpath('.//b')[6].text 
#or
number_I_want = parsed_body.xpath('.//span[@class="class_name"]')[0].text

我现在宁愿发现这一点,而不是更进一步。实际上我无法得到类似第二个表达式的东西来适应我的特定情况。

但基本上,问题是:依靠class名称(或其他关键字)或出现指数(例如第7次出现粗体文本)更好吗?

1 个答案:

答案 0 :(得分:1)

我说依靠id属性或默认情况下class通常比依赖于特定标记的出现次数和顺序更好。 这对页面内容的更改更具弹性。