正则表达式,从HTML中提取电子邮件

时间:2016-09-30 13:26:40

标签: html regex

如何通过此电子邮件提取电子邮件:

Email <a href=""mailto:aampianos@aol.com"">aampianos@aol.com</a>

我的正则表达式

(?<=Email)(.*)(?=<\/)

到目前为止,我能够放弃单词Email和'a'结束标记(</a>):

<a href=""mailto:aampianos@aol.com"">aampianos@aol.com

但是如何删除'a'开头标记以及href(<a href=""mailto:aampianos@aol.com"">)并且只留下电子邮件?

由于

2 个答案:

答案 0 :(得分:0)

不知道这是否有帮助,但我不会用RegEx做到这一点。会在mailto:之后尝试拆分并搜索下一个"。可能之间的一切都可能是一个电子邮件。

答案 1 :(得分:0)

真正的电子邮件正则表达式非常复杂,请参阅以下答案:https://stackoverflow.com/a/201378/2897426

一个非常简单的电子邮件验证正则表达式

/\S+@\S+\.\S+/

它在这里不起作用,因为电子邮件地址包含在文本中,因此您不能将\S用于任何非空白字符,但您可以匹配\w(字符,数字或下划线),-.为“允许”字符:

/([\w-\.]+@[\w-\.]+\.\w+)/

示例:http://regexr.com/3ebl6

请记住,我@ [127.0.0.1]也是一个有效的电子邮件地址。