HtmlAgilityPack - 使用c#解析带有cookie /标签的网站

时间:2014-11-18 13:04:40

标签: c# html-parsing html-agility-pack

当我想从网页获取数据时,我通常使用带有HtmlDocument对象的HtmlAgilityPack,该对象使用网站的主网址,然后将HtmlNode对象与主表一起使用,例如我需要的所有数据来自页面和将它的XPath复制到输入中。例如:

HtmlDocument hDocument = GetHtmlDocumentFromUrl("http://someweb.com");
HtmlNode mainNode = hDocument.DocumentNode.SelectSingleNode("//*[@id='XpathOfTableWithData']");

这样做之后,我可以循环到这个主节点的childNodes并得到我想要的东西,但是有些网站包含“标签”,它们比旧版网站更新,然后我就得到主要的节点为null。 如果页面包含cookie并有标签,我如何使用c#和HtmlAgilityPack获取此信息?

谢谢!

1 个答案:

答案 0 :(得分:0)

'tabs'应该仍然是使用CSS增强的html元素。如果您查看其中一个相关网站,您应该看到结构并相应地修改您的代码。