如何在文本文件中只保留一些关键字

时间:2011-02-18 08:22:27

标签: parsing email text


我有一个文本文件,里面有一些电子邮件。我需要删除所有没有关键字的电子邮件(例如:gmail,yahoo ...) 有没有办法做到这一点?
提前谢谢。

2 个答案:

答案 0 :(得分:0)

是。你想要哪种语言?

Smalltalk中的示例:

((FileStream fileNamed: 'emails.txt') 
    substrings: eMailSeparatorChar) 
    reject: [:a|a includesSubString: aKeyWord]

答案 1 :(得分:0)

假设每封电子邮件都在一行

grep -wEi 'gmail|yahoo|aol' emailFile

-w for words

-i不区分大小写

emailFile是包含电子邮件的文件。

以下更改输入文件。

grep -wEi 'gmail|yahoo|aol' emailFile > tempFile && cp tempFile emailFile && rm tempFile

如果您想在列表中添加更多内容,只需添加“|”即可serviceProvide