正则表达式排除电子邮件表达式

时间:2016-07-26 20:19:42

标签: html regex email notepad++ extract

我有430个不同组织的HTML文件联系我们的网页,我收到了这些文件以从中提取电子邮件。

我想出的这个正则表达式简单代码可以检测并查找整个文件中的电子邮件

\S*@\S*

我的问题

我试图选择除电子邮件之外的所有内容,以便我可以使用Notepad ++"全部替换所有打开的文档"用于删除电子邮件以外的所有内容。这是否可以使用正则表达式?

无论如何,我可以选择上面提供的正则表达式之外的所有内容吗?

2 个答案:

答案 0 :(得分:2)

确保安装了最新版本的Notepad ++以获得必要的正则表达式支持:

查找内容: (^|\s+)[^@]+(\s+|$)
替换为: \n
 正则表达式

.匹配换行符选项不会影响该操作。

答案 1 :(得分:1)

您需要删除与某些模式不匹配的所有文字。

您需要使用NSString *userID = [whoIs objectForKey:@"d"]; NSArray *components = [[NSArray alloc]init]; components = [userID componentsSeparatedByString:@"="]; NSString *ID = (NSString*) [components objectAtIndex:1]; 捕获组匹配和捕获电子邮件,然后您需要匹配其他所有内容。

使用这样的模式:(...) + ( + your_pattern,并替换为)|.

或者,使用:

$1

([^\s<>"]+@[^\s<>"]+)|.

替换为:(\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,4}\b)|.

然后,您可能想要使用编辑 - &gt; 空白操作 - &gt; 删除不必要的空白和EOL 菜单选项。