在c#中使用HtmlAgilityPack获取Web内容

时间:2014-09-15 19:40:58

标签: c# html html-agility-pack

我正在尝试使用HtmlAgilityPack获取网页内容,但我没有收到全部内容。

以下是我的代码:

using HAP=HtmlAgilityPack;
using HtmlAgilityPack;

using (var client = new System.Net.WebClient())
    {
        var filename = System.IO.Path.GetTempFileName();
        client.DownloadFile("http://www.cnn.com/", filename);
        var doc = new HAP.HtmlDocument();
        doc.Load(filename);

        var root = doc.DocumentNode;
        var a_nodes = root.Descendants("a").ToList();

        foreach (var a_node in a_nodes)
        {
            Console.WriteLine();


            Console.WriteLine(a_node.InnerText.Trim());
        }
    }

    Console.ReadKey();

输出:

http://imgur.com/Mv9Uh5q

正如您在屏幕截图中看到的那样,我从“娱乐”,“生活”等标签中获取内容,但上面没有任何内容。

有什么建议吗?

0 个答案:

没有答案