我正试图从各种网站上删除价格数据。一切正常,除了一个网站,其中价格的XPath对于每个产品页面是唯一的,例如
第A页 - //*[@id="price-including-tax-2940"]
第B页 - //*[@id="price-including-tax-1456"]
即它们都有唯一的编号作为查询字符串的一部分。
这是其中一个网页http://thepowersite.co.uk/honda-gx200-powered-gear-driven-pump-pressure-washer-b2565hag
的示例为了节省我在每个页面上找到价格的唯一XPath,我试图修改Xpath查询以删除唯一编号。我已经尝试了各种各样的事情,//*[id=[contains(.,'price-including')]]
但是我对XPath缺乏了解让我失望。
答案 0 :(得分:1)
对我而言,似乎你想要
gets
答案 1 :(得分:1)
您需要通过编写查询来确保contains
函数对id
属性的值进行操作:
//*[contains(@id, "price-including")]