正则表达式删除

时间:2014-04-09 21:17:23

标签: html regex

我们的HTML代码如下:

<h1><a name="_Toc22332223">Creating a record</a><h1>
<h1><a name="sectionB">Creating a record</a><h1>

是否有使用的表达式,我们可以找到并删除<a name=>,并保留以下文字:<h1>Creating a record<h1>

我们也无法删除其他超链接,例如<a href>

我试过<a name="[0-9]*">.+</a>无济于事。

谢谢!

1 个答案:

答案 0 :(得分:1)

正如其他人所建议的那样,DOM解析是最可靠的方法。

但如果必须非常简单,可以使用以下正则表达式

<[aA]\s+name\s*=[^>]*>(.*)[^<]<\/a>

http://rubular.com/r/cI2CTwUCy3

上的示例