c#如何以文本形式阅读网站内容?

时间:2011-10-22 03:37:36

标签: c#

如何获取网站内容?

我正在谈论的网站只是一个简单的页面,上面没有任何其他链接:

以此为例:http://introcs.cs.princeton.edu/java/23recursion/Queens.java.html

我只是想阅读内容并将其保存在字符串中,以后我可以轻松操作它。

有什么想法吗?还是教程?

提前致谢:)

4 个答案:

答案 0 :(得分:5)

using(System.Net.WebClient wc = new System.Net.WebClient()) {
    MessageBox.Show(wc.DownloadString("http://thewebsite.com/thepage.html")); // Or whatever
}

答案 1 :(得分:1)

我需要更多的澄清,除非我只是在密集。

您是否想要从命令行捕获此URL的输出?

如果是,您可以使用

wget -q "http://introcs.cs.princeton.edu/java/23recursion/Queens.java.html" -O captured_file.txt

再次,如果我完全误解了请求,请原谅我......

答案 2 :(得分:0)

您可以使用System.Net.WebClient类方法。

答案 3 :(得分:0)

喜欢这个吗?

/// ---- ScreenScrape --------------------------------
///
/// <summary>
/// Input: URL like  "http://www.microsoft.com"
/// Return: HTML string of site
/// </summary>

static public String ScreenScrape(String URL)
{
    WebRequest TheRequest = WebRequest.Create(URL);
    WebResponse TheResponse = TheRequest.GetResponse();

    StreamReader TheStreamReader = new StreamReader(TheResponse.GetResponseStream(), Encoding.UTF8);

    String HTML = TheStreamReader.ReadToEnd();

    return HTML;
}