我应该如何使用HTMLAgilityPack AppendNode?

时间:2010-01-22 15:46:18

标签: c# screen-scraping html-agility-pack

星期五这个阶段真的很头疼!我正在尝试使用InsertAfter()将HtmlNode添加到另一个。当我将它发送到控制台时,我可以看到id为breadcrumbs的refChild节点但是一直收到以下错误:

System.ArgumentOutOfRangeException: Node "<div id="breadcrumb"></div>" was not f
ound in the collection
Parameter name: node
   at HtmlAgilityPack.HtmlNodeCollection.get_Item(HtmlNode node)
   at HtmlAgilityPack.HtmlNode.InsertAfter(HtmlNode newChild, HtmlNode refChild)

   at MyHome.Tasks.Tasks.DownloadandStoreContent(KeyValueP
air`2 urlPair, String filePath, HtmlNode HtmlWrapper) in C:\Users\denis\Document
s\Visual Studio 2008\Websites\MyHomeV2\MyHome.Tasks\Tasks.cs:line 81
   at MyHome.Tasks.Tasks.GenerateContent(String scrape
sSwitch, String filePath) in C:\Users\denis\Documents\Visual Studio 2008\Website
s\MyHomeV2\MyHome.Tasks\Tasks.cs:line 27
   at MyHome.Tasks.Program.Main(String[] args) in C:\Users\denis\Documents\Visua
l Studio 2008\Websites\MyHomeV2\MyHome.Tasks\Program.cs:line 87

我的代码是:

HtmlWrapper.InsertAfter(ContentNode, HtmlWrapper.SelectSingleNode("//div[@id='breadcrumb']"));

如前所述,我已将HtmlWrapper和HtmlWrapper.SelectSingleNode(“// div [@ id ='breadcrumb']”)打印到控制台,并可在屏幕上看到该节点。关于我在哪里出错的任何想法?

谢谢, 丹尼斯

1 个答案:

答案 0 :(得分:7)

通过对源代码的粗略检查,看起来InsertAfter希望refChild成为您调用InsertAfter的节点的直接子项。由于您正在为//节点搜索整个后代轴(div),因此您作为refChild传递的实际节点可能不是直接子节点 of HtmlWrapper

尝试将HtmlWrapper.SelectSingleNode("//div[@id='breadcrumb']")拉入变量,然后在其InsertAfter上调用ParentNode