删除父节点但保留子节点htmlagility包?

时间:2016-10-14 00:36:48

标签: c# html-agility-pack

好的,我在这里难过,如何删除父节点并将其替换为子节点?

我的目标是从图像中删除出站链接。我不想从文档中删除普通链接,只需删除将图像转换为链接的链接,同时保持图像完好无损。  例如:

<a href="http://www.w3schools.com"><img src="logo_w3s.gif"></a>

应该被替换并成为:

<img src="logo_w3s.gif">

这是我的代码不起作用,但我觉得越来越近了:

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(maintext);
dynamic allimages = doc.DocumentNode.Descendants("img").ToList;

if (scrapeimages.Checked) {
    //the user does want images scraped. Remove image outbound links
    try {
        foreach (void n_loopVariable in allimages) {
            n = n_loopVariable;
            if (n.ParentNode.Name == "a") {
                dynamic outer = n.OuterHtml;
                dynamic newnode = HtmlNode.CreateNode(outer);

                n.ParentNode.ReplaceChild(n.ParentNode, newnode);

            }
        }
        maintext = doc.DocumentNode.OuterHtml;
    } catch {
    }
}

1 个答案:

答案 0 :(得分:1)

var node = doc.DocumentNode.SelectSingleNode(yourANode);
node.ParentNode.RemoveChild(node, true);

这样的东西应该有帮助,这将删除<a>的父节点的Child,但它会保留grandChildren。 RemoveChild中的此真实参数表示keepGrandChild

如果所有<img>都有<a>

var nodeList = doc.DocumentNode.SelectNodes("img");

for(HtmlNode node in nodeList)
{
    var parentATagNode = node.Parent.Parent;
    parentATagNode.RemoveChild(node.Parent, true);
}