我们的HTML代码如下:
<h1><a name="_Toc22332223">Creating a record</a><h1>
<h1><a name="sectionB">Creating a record</a><h1>
是否有使用的表达式,我们可以找到并删除<a name=>
,并保留以下文字:<h1>Creating a record<h1>
我们也无法删除其他超链接,例如<a href>
我试过<a name="[0-9]*">.+</a>
无济于事。
谢谢!
答案 0 :(得分:1)
正如其他人所建议的那样,DOM解析是最可靠的方法。
但如果必须非常简单,可以使用以下正则表达式
<[aA]\s+name\s*=[^>]*>(.*)[^<]<\/a>
上的示例