我正在尝试下载HTML,因此我可以使用最小带宽进行解析。这是我的一些代码。
if (!String.IsNullOrEmpty(siteAddress))
webReq = WebRequest.Create(siteAddress)
WebResponse webRes = webReq.GetResponse();
Stream streamResponse = webRes.GetResponseStream();
StreamReader streamRead = new StreamReader(streamResponse);
StringReader sr = new StringReader(streamRead.ReadToEnd().Trim());
streamResponse.Close();
streamRead.Close();
webRes.Close();
HtmlAgilityPack.HtmlDocument hDoc = new HtmlAgilityPack.HtmlDocument();
hDoc.Load(sr);
有人可以确认检索响应只提供文本响应,也没有下载图像吗?使用HTMLAgilityPack方法加载它时怎么样?
答案 0 :(得分:2)
使用WebClient
,WebRequest
或HtmlAgilityPack
时,您只需下载 html 。
如果您想要图片(或其他资源),您必须在下载的文档中搜索图片网址并自行发出请求以获取图片网址。
如果您想进行一些实验,可以查看WebBrowser
控件。从那里,您可以获取Document
属性并查看其属性Images
并自行下载所有图像。
你想做什么?
答案 1 :(得分:1)
您下载网站的HTML源代码,而不是整个网站。这是一个很大的不同。
请参阅如何使用HTML Agility Pack以及this one