通过regex删除ID属性的锚标记

时间:2016-08-23 01:42:47

标签: c# html regex

从HTML字符串中删除带有ID属性的锚标记

示例。

<div>
    <p>
        Test code
    </p>
    <a id =some value></a>
    <a href=URL ></a>
</div>

必须删除具有ID属性的锚标记。 输出应该是:

<div>
    <p>
        Test code
    </p>
    <a href=URL ></a>
</div>

1 个答案:

答案 0 :(得分:1)

您可以尝试使用HtmlAgilityPack代替使用Regex。

HtmlAgilityPack.HtmlDocument htmldoc = new HtmlAgilityPack.HtmlDocument();
var Anchors = htmldoc.DocumentNode.SelectNodes("//a");
foreach (var tag in Anchors)
{
    if(tag.Attributes["id"] != null) 
    {
        tag.Remove();
    }
}