无法通过网址获取正确的网页源代码 - c#

时间:2017-06-25 18:25:56

标签: c# html url webpage google-image-search

我试图获取谷歌搜索图像页面的源代码。因此,按图片搜索网址为https://www.images.google.com/searchbyimage?image_url=x x是图片网址。

我使用该代码,但我得到的源代码是google图片的源代码,而不是特定搜索结果网页的源代码。

public static string GetSourceCode(string url)
{
    HttpWebRequest myRequest = (HttpWebRequest)WebRequest.Create(url);
    myRequest.Method = "GET";
    WebResponse myResponse = myRequest.GetResponse();
    StreamReader sr = new StreamReader(myResponse.GetResponseStream(), System.Text.Encoding.UTF8);
    string result = sr.ReadToEnd();
    sr.Close();
    myResponse.Close();

    return result;
}

1 个答案:

答案 0 :(得分:0)

当您执行Google搜索时,Google只会返回一些HTML(您在浏览器中打开结果字符串时会看到)。运行结果中的JavaScript以加载实际搜索结果。

作为旁注,在Chrome中(至少,我实际测试过它)你可以观看JavaScript运行,如果你在'load'设置一个断点。