正则表达式获得没有单词的行

时间:2009-07-21 09:50:19

标签: regex

我在文件中有以下几行:

a class="rss tip" rel="direct" title="Linq2Sql" href="http://feeds2.feedburner.com/pippo_ORM"></a>
a class="rss tip" title="ORM" href="http://feeds2.feedburner.com/pippo_ORM" rel="nofollow"></a>
a class="rss tip" rel="boh" title="Nhibernate" href="http://feeds2.feedburner.com/pippo_ORM"></a>
a class="rss tip" rel="direct" title="Linq2Sql" href="http://pippo.it/pippo_ORM"></a>
a class="rss tip" title="Linq2Sql" href="http://pippo.it/pippo_ORM"></a>
<a class="rss tip" title="direct" href="pippo"></a>

我需要在href中获取所有没有url“pippo.it”的锚点。 我想从结果中删除包含单词rel =“direct”的行。

我该怎么做?

我使用RegexBuddy,我需要将代码放在.NET控制台程序上。 我需要搜索整个文件中的行。

TNX

3 个答案:

答案 0 :(得分:1)

grep -v 'href="[^"]*pippo.it\|rel="direct"' file.txt

答案 1 :(得分:0)

这样的事情应该这样做

grep -v "pippo.it" myfile.txt | grep -v "rel=\"direct\""

-v反转匹配,以便输出没有模式的行

答案 2 :(得分:0)

awk '!/rel=\"direct\"/ && !/href.*pippo.it/s' file