html Agility包仅获得第一个网页的来源

时间:2016-04-03 08:07:56

标签: parsing xpath html-agility-pack

我想使用Html敏捷包抓取一个电子商务网站,但我有一个问题,html敏捷包正在获取前端网页的来源,因为当我试图获取该网站内部或子项目的来源时我没有从源代码中获得那些来自html敏捷包的代码。当我点击项目然后我可以通过firebug看到子菜单项的代码但不是我拥有的实际来源。所以请指导我或告诉我怎么做

string url=""; 
 WebClient client = new WebClient();
                client.Headers[HttpRequestHeader.UserAgent] = "Mozilla/45.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/46.0.2490.80 Safari/537.36";
                html = client.DownloadString(url);
                HtmlDocument doc = new HtmlDocument();
                doc.LoadHtml(html);

通过使用html敏捷包的代码,我只能拥有第一个网页的代码

1 个答案:

答案 0 :(得分:0)

对此进行了测试,它获取了针对特定网址的整个网站的代码