清理邮件列表

时间:2013-03-27 09:41:29

标签: list email

我的记事本中有3000个邮件列表,但问题是除了空格和引号之外我还需要删除重复的电子邮件,因此任何建议自动执行此操作的脚本而不是花费数小时来修复它 谢谢

1 个答案:

答案 0 :(得分:0)

为聚会迟到了,但我改编了一个脚本来阅读包含电子邮件的文件,并使用RFC822正则表达式,域名拼写列表,mx查找(感谢eagle1)和模糊的电子邮件过滤来过滤它。

该脚本可以像:

一样使用
./emailCheck.sh /path/to/emailList

并生成两个文件,即筛选列表和不明确的列表。两者都已从非RFC822兼容地址,没有有效MX域的电子邮件域以及域拼写错误中清除。

然后您可以删除重复项:

sort -u emaillist

脚本可以在这里找到:https://github.com/deajan/linuxscripts

欢迎更正和评论:)