Question

我想知道如何使用selenium python收集line，mailto链接，电子邮件包含联系人页面中的@sign我尝试了下面的代码，但它在某处工作，某处不在..

//*[contains(text(),"@")]

电子邮件格式在<p>Email: name@domain.com</p>或<span>Email: name@domain.com</span>或<a href="mailto:name@domain.com">name@domain.com</a>

的某处不同

无论如何都要用一个陈述来收集它们。

由于

Answer 1

这是您正在寻找我朋友的XPath。

//*[contains(text(),"@")]|//*[contains(@href,"@")]

Answer 2

您可以在页面上创建包含@的链接文本值的集合，然后迭代进行格式化。无论如何，您将不得不像使用电子邮件：name@domain.com那样格式化范围。

使用find_elements_by_partial_link_text进行收集。

Answer 3

我认为你需要2个XPath。第一个XPath用于查找包含文本“Email：”的元素，第二个XPath用于包含属性“mailto：”的元素。

//*[contains(text(),"Email:")]|//*[contains(@href,"mailto:")]