我有一个正则表达式,它通过html标签运行并获取值。 我目前有这个来获取标签内的所有值。
<title\b[^>]*>(.*\s?)</title>
完美无缺。所以如果我有一堆有标题的页面:
<title>Index</title>
<title>Artwork</title>
<title>Theory</title>
返回的值是: 索引下, 的图形下, 的理论
如何使这个正则表达式忽略其中包含值Theory的所有标记?
先谢谢
答案 0 :(得分:0)
基本了解would probably handle that。
<title\b[^>]*>(((?!Juju - Search Results).)*)(.*\s?)</title>
答案 1 :(得分:0)
如果您的文件input_file.txt包含:
<title>Index</title>
<title>Artwork</title>
<title>Theory</title>
然后,以下命令将从input_file.txt中删除包含Theory的行,并将结果放在output_file.txt中。
sed '/Theory/d' input_file.txt > output_file.txt
如果你在vim工作: 这将删除包含的行 克/符\ v ^(。*理论)@!/ d