从Google图书下载文件

时间:2011-04-28 10:37:17

标签: c# console-application

我写的是非常简单的应用程序。它应该从互联网上下载文件。我有要保存在表格中的文件的URL和名称。但我的代码不起作用。

for (int i = 1; i < links.Length; i++)
{
    Uri uri = new Uri(links[i]);

    HttpWebRequest webRequest = (HttpWebRequest)WebRequest.Create(uri);
    webRequest.Method = "GET";

    HttpWebResponse webResponse = (HttpWebResponse)webRequest.GetResponse();

    Stream responseStream = webResponse.GetResponseStream();
    StreamReader responseStreamReader = new StreamReader(responseStream);
    String result = responseStreamReader.ReadToEnd();

    StreamWriter w = new StreamWriter(savepath + names[i]);
    w.Write(result);
    w.Close();

    break;
}

示例网址: http://books.google.pl/books?id=yOz1ePt39WQC&pg=PA2&img=1&zoom=3&hl=pl&sig=ACfU3U0MDQtXGU_3YVqGvcsDiWLLcKh0KA&w=800&gbd=1

示例名称:     002.png

文件将保存为PNG图像,但我会得到一些开头的内容     <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN""http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">

第二次问题。尝试下载时如何检测HTTP 404错误?

编辑: 我的错。我的链接不正确。将&amp;替换为&后,他们是正确的。 示例链接(已更正):

http://books.google.pl/books?id=yOz1ePt39WQC&pg=PA2&img=1&zoom=3&hl=pl&sig=ACfU3U0MDQtXGU_3YVqGvcsDiWLLcKh0KA&w=800&gbd=1

尽管如此我还是无法正确下载PNG。 他们没有开放。但至少它们不是HTML页面。 我在想将它们保存为字符串并不是一个好主意。但我不知道我怎么能做到这一点。也许使用byte []或其他东西?

1 个答案:

答案 0 :(得分:5)

您是否尝试过WebClient.DownloadFile

string url = "http://books.google.pl/books?id=yOz1ePt39WQC&pg=PA2&img=1&zoom=3&hl=pl&sig=ACfU3U0MDQtXGU_3YVqGvcsDiWLLcKh0KA&w=800&gbd=1";
string file = "002.png";

WebClient wc = new WebClient();
wc.DownloadFile(url, file);

将图像保存在应用程序目录中,为002.png。