当我想从网页获取数据时,我通常使用带有HtmlDocument对象的HtmlAgilityPack,该对象使用网站的主网址,然后将HtmlNode对象与主表一起使用,例如我需要的所有数据来自页面和将它的XPath复制到输入中。例如:
HtmlDocument hDocument = GetHtmlDocumentFromUrl("http://someweb.com");
HtmlNode mainNode = hDocument.DocumentNode.SelectSingleNode("//*[@id='XpathOfTableWithData']");
这样做之后,我可以循环到这个主节点的childNodes并得到我想要的东西,但是有些网站包含“标签”,它们比旧版网站更新,然后我就得到主要的节点为null。 如果页面包含cookie并有标签,我如何使用c#和HtmlAgilityPack获取此信息?
谢谢!
答案 0 :(得分:0)
'tabs'应该仍然是使用CSS增强的html元素。如果您查看其中一个相关网站,您应该看到结构并相应地修改您的代码。