如何使用Selenium Python收集行

时间:2016-01-29 19:45:29

标签: python selenium

我想知道如何使用selenium python收集line,mailto链接,电子邮件包含联系人页面中的@sign我尝试了下面的代码,但它在某处工作,某处不在..

//*[contains(text(),"@")]

电子邮件格式在<p>Email: name@domain.com</p><span>Email: name@domain.com</span><a href="mailto:name@domain.com">name@domain.com</a>

的某处不同

无论如何都要用一个陈述来收集它们。

由于

3 个答案:

答案 0 :(得分:1)

这是您正在寻找我朋友的XPath。

//*[contains(text(),"@")]|//*[contains(@href,"@")]

答案 1 :(得分:0)

您可以在页面上创建包含@的链接文本值的集合,然后迭代进行格式化。无论如何,您将不得不像使用电子邮件:name@domain.com那样格式化范围。

使用find_elements_by_partial_link_text进行收集。

答案 2 :(得分:0)

我认为你需要2个XPath。第一个XPath用于查找包含文本“Email:”的元素,第二个XPath用于包含属性“mailto:”的元素。

//*[contains(text(),"Email:")]|//*[contains(@href,"mailto:")]