我的记事本中有3000个邮件列表,但问题是除了空格和引号之外我还需要删除重复的电子邮件,因此任何建议自动执行此操作的脚本而不是花费数小时来修复它 谢谢
答案 0 :(得分:0)
为聚会迟到了,但我改编了一个脚本来阅读包含电子邮件的文件,并使用RFC822正则表达式,域名拼写列表,mx查找(感谢eagle1)和模糊的电子邮件过滤来过滤它。
该脚本可以像:
一样使用./emailCheck.sh /path/to/emailList
并生成两个文件,即筛选列表和不明确的列表。两者都已从非RFC822兼容地址,没有有效MX域的电子邮件域以及域拼写错误中清除。
然后您可以删除重复项:
sort -u emaillist
脚本可以在这里找到:https://github.com/deajan/linuxscripts
欢迎更正和评论:)