Question

我有一个正则表达式，它通过html标签运行并获取值。我目前有这个来获取标签内的所有值。

<title\b[^>]*>(.*\s?)</title>

完美无缺。所以如果我有一堆有标题的页面：

<title>Index</title>

<title>Artwork</title>

<title>Theory</title>

返回的值是：索引下，的图形下，的理论

如何使这个正则表达式忽略其中包含值Theory的所有标记？

先谢谢

Answer 1

<title\b[^>]*>(((?!Juju - Search Results).)*)(.*\s?)</title>

Answer 2

如果您的文件input_file.txt包含：

<title>Index</title>

<title>Artwork</title>

<title>Theory</title>

然后，以下命令将从input_file.txt中删除包含Theory的行，并将结果放在output_file.txt中。

sed '/Theory/d' input_file.txt > output_file.txt

如果你在vim工作：这将删除包含的行克/符\ v ^（。*理论）@！/ d