如何在vb.net或perl中下载网页的页面源信息

时间:2011-04-08 19:36:16

标签: vb.net winforms perl http firefox

我想下载在浏览器中右键单击查看页面源时获得的相同信息。我想在vb.net或perl中执行此操作

我需要谷歌图片搜索结果网页。 保存该页面后,html代码与视图页面源信息不同。 没有图像标签。

在vb.net中我试过

     Dim objHttp As Object, strURL As String, strText As String

    objHttp = CreateObject("MSXML2.ServerXMLHTTP")

    strURL = "http://www.google.co.uk/images?as_q=aboriginal&hl=en&output=search&tbs=isch:1,iur:fmc&btnG=Google+Search&as_epq=&as_oq=&as_eq=&as_sitesearch=&safe=images&as_st=y&biw=1600&bih=799"

    objHttp.Open("GET", strURL, False)
    objHttp.setRequestHeader("User-Agent", _
      "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)", "Accept", "image/png,image/*;q=0.8,*/*;q=0.5")

    objHttp.Send("")

    strText = objHttp.responseText

    objHttp = Nothing

    RichTextBox1.Text = strText

虽然上面的方法给出了搜索结果图像的链接但它不返回图像标签(通过图像标签,我指的是谷歌图像搜索中每个图像下方的短句)。

有没有办法在vb.net或perl中获取整个视图页面源信息

2 个答案:

答案 0 :(得分:0)

我会尝试:

在浏览器中关闭Javascript。现在去访问Google图片搜索页面(源代码中链接的页面) - 网址会略有变化。

我猜测用vb加载稍微改变的URL会给你定期的html而不是一堆模糊的javascript。

答案 1 :(得分:0)