在我的代码中,我想删除没有src值的img标记。 我正在使用 HTMLAgilitypack的HtmlDocument 对象。 我发现img没有src值并试图删除它..但它给了我错误集合被修改;枚举操作可能无法执行。 任何人都可以帮助我吗? 我使用的代码是:
foreach (HtmlNode node in doc.DocumentNode.DescendantNodes())
{
if (node.Name.ToLower() == "img")
{
string src = node.Attributes["src"].Value;
if (string.IsNullOrEmpty(src))
{
node.ParentNode.RemoveChild(node, false);
}
}
else
{
..........// i am performing other operations on document
}
}
答案 0 :(得分:22)
似乎您在枚举期间使用HtmlNode.RemoveChild
方法修改了集合。
要解决此问题,您需要通过调用例如将节点复制到单独的列表/数组中。 Enumerable.ToList<T>()
或Enumerable.ToArray<T>()
。
var nodesToRemove = doc.DocumentNode
.SelectNodes("//img[not(string-length(normalize-space(@src)))]")
.ToList();
foreach (var node in nodesToRemove)
node.Remove();
如果我是对的,问题就会消失。
答案 1 :(得分:6)
我所做的是:
List<string> xpaths = new List<string>();
foreach (HtmlNode node in doc.DocumentNode.DescendantNodes())
{
if (node.Name.ToLower() == "img")
{
string src = node.Attributes["src"].Value;
if (string.IsNullOrEmpty(src))
{
xpaths.Add(node.XPath);
continue;
}
}
}
foreach (string xpath in xpaths)
{
doc.DocumentNode.SelectSingleNode(xpath).Remove();
}
答案 2 :(得分:2)
var emptyImages = doc.DocumentNode
.Descendants("img")
.Where(x => x.Attributes["src"] == null || x.Attributes["src"].Value == String.Empty)
.Select(x => x.XPath)
.ToList();
emptyImages.ForEach(xpath => {
var node = doc.DocumentNode.SelectSingleNode(xpath);
if (node != null) { node.Remove(); }
});
答案 3 :(得分:0)
var emptyElements = doc.DocumentNode
.Descendants("a")
.Where(x => x.Attributes["src"] == null || x.Attributes["src"].Value == String.Empty)
.ToList();
emptyElements.ForEach(node => {
if (node != null){ node.Remove();}
});