我正在努力编写一个访问网站的Windows服务,使用存储的凭据登录,然后下载HTML来解析它。您认为最好的方法是什么?
答案 0 :(得分:0)
您可以使用WebClient类。
以下是一些示例(它是ASP.NET,但代码同样适用于在服务中使用):Screen Scraping, ViewState, and Authentication using ASP.Net
答案 1 :(得分:0)
如果你真的必须这样做(网络服务器不提供web服务),请使用HttpWebRequest(http://msdn.microsoft.com/en-us/library/system.net.httpwebrequest.aspx)并使用Regex或一些html解析lib解析HTML。
或者WebClient,当然。
答案 2 :(得分:0)
如果是特定网站,您可以立即发送所需的POST数据并绕过解析登录页面。您需要HttpWebRequest
或WebClient
。您需要打开连接,发送发布数据,然后检索您的响应。比我想进入这里要复杂一点:)
用于解析HTML页面,我已经成功使用了HtmlAgilityPack
答案 3 :(得分:0)
您可以托管IRobotX activex控件,并运行Web机器人来检索页面。