我一直尝试使用xpath从以下代码中提取电子邮件地址很长一段时间,但没有成功......
http://pastie.org/4172907(第78行)
这是我到目前为止所尝试的:
//tr/td/div[@class='geTextA5'][2]/a
我一直在使用xpath超过三个小时,尝试了许多不同的变化。我对xpath很新,所以我希望有更简单的方法来实现这个目标。
我很感激任何帮助。
答案 0 :(得分:8)
如果您确信所有电子邮件都有例如示例中的mailto超链接,那么您可以尝试以下xpath。
//a[starts-with(@href, 'mailto')]/text()
答案 1 :(得分:1)
要进一步添加,如果您要解析文本中的电子邮件,但它们未包含在锚点中:
//*[contains(text(), '@')]