xpath无法返回html文档的头部

时间:2013-07-06 10:28:28

标签: html asp.net xpath html-agility-pack

我正在尝试使用http://www.aspemail.com阅读此链接HtmlAtiligtyPack。但它无法读取head部分并返回null。

     HtmlAgilityPack.HtmlDocument htmlDocument = new HtmlDocument();
        System.Net.WebClient webClient = new System.Net.WebClient();
        string download = webClient.DownloadString(linkDetails.Url);

        htmlDocument.LoadHtml(download);
        HtmlNode htmlNode = htmlDocument.DocumentNode.SelectSingleNode("html/head");

但是当我检查断点时,htmlNode包含null。我正在使用这个程序吗?

1 个答案:

答案 0 :(得分:2)

SelectSingleNode("html/head");

你看过这个网站的来源了吗?其中没有<html>个节点。最后只有一个结束</html>,但是源代码直接以<head> - OMG开头,现在有什么样的人在编写网站真是令人难以置信。

您可以像这样调整您的选择器:

HtmlNode htmlNode = htmlDocument.DocumentNode.SelectSingleNode("head");