public string ExtractContent(string html)
{
var doc = new HtmlDocument();
doc.LoadHtml(html);
foreach (var node in doc.QuerySelectorAll("footer"))
{
node.Remove();
}
foreach (var node in doc.QuerySelectorAll("aside"))
{
node.Remove();
}
return doc.Text;
}
在生成的HTML中,我仍然可以看到<footer>
元素和<aside>
元素。
我猜节点不是引用类型吗?如何从HTML中删除这些元素?
谢谢!