如何排除包含错误TLD的电子邮件

时间:2015-05-27 18:28:26

标签: regex

我不是RegEx的专家,但我需要以某种方式忽略以某些错误TLD结尾的电子邮件地址。通常是它的gif,png等。

如何将其合并,以便忽略pnggif的电子邮件。

这是我的表达:

[a-z0-9\.\-+_]+@[a-z0-9\.\-+_]+\.[a-z]+

以Python形式:

re.findall(r'[a-z0-9\.\-+_]+@[a-z0-9\.\-+_]+\.[a-z]+', "this@test.com, this@test.png")

小提琴: http://refiddle.com/refiddles/55660c5b75622d4d8c800000

2 个答案:

答案 0 :(得分:1)

尝试使用鞋拔角进行正则表达式是浪费时间。只需应用您的初始正则表达式,然后过滤掉任何“坏”域名作为辅助检查。

FWIW,我们从允许的电子邮件地址列表中排除“.con”,因为用户一直将.com写为.con。

答案 1 :(得分:1)

您可以使用" Negative Lookahead"排除它们:

[a-z0-9\.\-+_]+@[a-z0-9\.\-+_]+\.((?!png|gif)([a-z]+))