我想知道如何使用selenium python收集line,mailto链接,电子邮件包含联系人页面中的@sign我尝试了下面的代码,但它在某处工作,某处不在..
//*[contains(text(),"@")]
电子邮件格式在<p>Email: name@domain.com</p>
或<span>Email: name@domain.com</span>
或<a href="mailto:name@domain.com">name@domain.com</a>
无论如何都要用一个陈述来收集它们。
由于
答案 0 :(得分:1)
这是您正在寻找我朋友的XPath。
//*[contains(text(),"@")]|//*[contains(@href,"@")]
答案 1 :(得分:0)
您可以在页面上创建包含@的链接文本值的集合,然后迭代进行格式化。无论如何,您将不得不像使用电子邮件:name@domain.com那样格式化范围。
使用find_elements_by_partial_link_text进行收集。
答案 2 :(得分:0)
我认为你需要2个XPath。第一个XPath用于查找包含文本“Email:”的元素,第二个XPath用于包含属性“mailto:”的元素。
//*[contains(text(),"Email:")]|//*[contains(@href,"mailto:")]