如何获取网站内容?
我正在谈论的网站只是一个简单的页面,上面没有任何其他链接:
以此为例:http://introcs.cs.princeton.edu/java/23recursion/Queens.java.html
我只是想阅读内容并将其保存在字符串中,以后我可以轻松操作它。
有什么想法吗?还是教程?
提前致谢:)
答案 0 :(得分:5)
using(System.Net.WebClient wc = new System.Net.WebClient()) {
MessageBox.Show(wc.DownloadString("http://thewebsite.com/thepage.html")); // Or whatever
}
答案 1 :(得分:1)
我需要更多的澄清,除非我只是在密集。
您是否想要从命令行捕获此URL的输出?
如果是,您可以使用
wget -q "http://introcs.cs.princeton.edu/java/23recursion/Queens.java.html" -O captured_file.txt
再次,如果我完全误解了请求,请原谅我......
答案 2 :(得分:0)
您可以使用System.Net.WebClient类方法。
答案 3 :(得分:0)
喜欢这个吗?
/// ---- ScreenScrape --------------------------------
///
/// <summary>
/// Input: URL like "http://www.microsoft.com"
/// Return: HTML string of site
/// </summary>
static public String ScreenScrape(String URL)
{
WebRequest TheRequest = WebRequest.Create(URL);
WebResponse TheResponse = TheRequest.GetResponse();
StreamReader TheStreamReader = new StreamReader(TheResponse.GetResponseStream(), Encoding.UTF8);
String HTML = TheStreamReader.ReadToEnd();
return HTML;
}