Question

我必须从某些.txt文档中提取所有电子邮件地址。这些电子邮件可能具有以下格式：

a@abc.com
{a, b, c}@abc.edu
其他一些格式，包括一些@标志。

我选择ruby作为我的第一语言来编写这个程序，但我不知道如何编写正则表达式。有人会帮助我吗？谢谢！

Answer 1

根据.txt文档的性质，您不必使用其中一个尝试验证电子邮件地址的复杂正则表达式。你不是要试图验证任何东西。你只是想抓住已有的东西。一般来说，获取已有内容的正则表达式比需要验证输入的正则表达式简单得多。

一个重要的问题是.txt文档是否包含不属于您要提取的电子邮件地址的@符号。

此正则表达式处理您的前两个要求：

\w+@[\w.-]+|\{(?:\w+, *)+\w+\}@[\w.-]+

或者，如果您想允许包含@符号的任何非空格字符序列加上您的第二个要求（具有空格）：

\S+@\S+|\{(?:\w+, *)+\w+\}@[\w.-]+

Answer 2

请看一下in-depth analysis：

Upshot使用此正则表达式：

/^([\w\!\#$\%\&\'\*\+\-\/\=\?\^\`{\|\}\~]+\.)*[\w\!\#$\%\&\'\*\+\-\/\=\?\^\`{\|\}\~]+@((((([a-z0-9]{1}[a-z0-9\-]{0,62}[a-z0-9]{1})|[a-z])\.)+[a-z]{2,6})|(\d{1,3}\.){3}\d{1,3}(\:\d{1,5})?)$/i

Answer 3

在满足我需求的https://www.shellhacks.com/regex-find-email-addresses-file-grep/找到了这个：

\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,6}\b

使用ruby从某些.txt文档中提取所有电子邮件地址

3 个答案: