Question

如何获取网站内容？

我正在谈论的网站只是一个简单的页面，上面没有任何其他链接：

以此为例：http://introcs.cs.princeton.edu/java/23recursion/Queens.java.html

我只是想阅读内容并将其保存在字符串中，以后我可以轻松操作它。

有什么想法吗？还是教程？

提前致谢：）

Answer 1

using(System.Net.WebClient wc = new System.Net.WebClient()) {
    MessageBox.Show(wc.DownloadString("http://thewebsite.com/thepage.html")); // Or whatever
}

Answer 2

我需要更多的澄清，除非我只是在密集。

您是否想要从命令行捕获此URL的输出？

如果是，您可以使用

wget -q "http://introcs.cs.princeton.edu/java/23recursion/Queens.java.html" -O captured_file.txt

再次，如果我完全误解了请求，请原谅我......

Answer 3

您可以使用System.Net.WebClient类方法。

Answer 4

喜欢这个吗？

/// ---- ScreenScrape --------------------------------
///
/// <summary>
/// Input: URL like  "http://www.microsoft.com"
/// Return: HTML string of site
/// </summary>

static public String ScreenScrape(String URL)
{
    WebRequest TheRequest = WebRequest.Create(URL);
    WebResponse TheResponse = TheRequest.GetResponse();

    StreamReader TheStreamReader = new StreamReader(TheResponse.GetResponseStream(), Encoding.UTF8);

    String HTML = TheStreamReader.ReadToEnd();

    return HTML;
}

c＃如何以文本形式阅读网站内容？

4 个答案: