我想下载在浏览器中右键单击查看页面源时获得的相同信息。我想在vb.net或perl中执行此操作
我需要谷歌图片搜索结果网页。 保存该页面后,html代码与视图页面源信息不同。 没有图像标签。
在vb.net中我试过
Dim objHttp As Object, strURL As String, strText As String
objHttp = CreateObject("MSXML2.ServerXMLHTTP")
strURL = "http://www.google.co.uk/images?as_q=aboriginal&hl=en&output=search&tbs=isch:1,iur:fmc&btnG=Google+Search&as_epq=&as_oq=&as_eq=&as_sitesearch=&safe=images&as_st=y&biw=1600&bih=799"
objHttp.Open("GET", strURL, False)
objHttp.setRequestHeader("User-Agent", _
"Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)", "Accept", "image/png,image/*;q=0.8,*/*;q=0.5")
objHttp.Send("")
strText = objHttp.responseText
objHttp = Nothing
RichTextBox1.Text = strText
虽然上面的方法给出了搜索结果图像的链接但它不返回图像标签(通过图像标签,我指的是谷歌图像搜索中每个图像下方的短句)。
有没有办法在vb.net或perl中获取整个视图页面源信息
答案 0 :(得分:0)
我会尝试:
在浏览器中关闭Javascript。现在去访问Google图片搜索页面(源代码中链接的页面) - 网址会略有变化。
我猜测用vb加载稍微改变的URL会给你定期的html而不是一堆模糊的javascript。
答案 1 :(得分:0)