在使用Scrapy筛选网站时,我对Xpath的contains的使用或是否能够创建更简洁的语句有一个普遍的疑问。
例如,在西班牙语和英语网站中查找“联系人”链接时,我一直在使用以下Xpath查询:
//*[contains(text(), 'Contact') or contains(text(), 'Contact Us') or contains(text(), 'Contactar') or contains(text(),'Contacto') or contains(text(), 'Contáctenos')]
我面临的问题是上面的查询可能存在一些歧义。例如,如果一个网站具有“ Contacto”和“ Contactenos”链接,对我来说还不清楚返回哪个网站。我已经尝试过更改顺序,但是,就像大多数我惯用的or
语句一样,返回哪一个似乎没有什么区别。有人知道'or'关键字的运行方式吗?