使用正则表达式删除不需要的标

时间:2011-08-25 16:44:46

标签: html regex

这是我的文字:

301 Roger Complex, Nr. Saint Martin Rd, NY ,380009<br /><a class="popsearchfont" href="javascript:jd_initialize(2, 1, 4);_clickTracker('viewmap','lspg');"><b>View Map</b></a>

我想删除<br />之后的所有内容,以便使用正则表达式显示如下:

301 Roger Complex, Nr. Saint Martin Rd, NY ,380009

2 个答案:

答案 0 :(得分:2)

可以使用简单的sed命令在Vim中完成。

:%s/<br \/>.*$//g

答案 1 :(得分:1)

所以听起来你想要删除与此匹配的所有内容:

/<br \/>.*$/i

或者保持与此匹配的所有内容:

/^.*?(?=<br \/>)/i

其中任何一个应该起作用;随便挑选你喜欢的任何东西。请注意,< br >之类的内容仍然是有效的HTML,因此如果您不确定实际输入会是什么样,您可能需要考虑将<br \/>更改为<\s*br\s*\/?>甚至{{ 1}}。