有没有办法在不获取内容正文的情况下发出GET请求?

时间:2010-09-08 19:58:23

标签: html http protocols network-protocols

我正在尝试按照302链接执行HEAD请求,但是这个链接:http://news.google.com/news/url?sa=t&fd=R&usg=AFQjCNGrJk-F7Dmshmtze2yhifxRsv8sRg&url=http://www.mtv.com/news/articles/1647243/20100907/story.jhtml

很麻烦,因为HEAD请求返回200 OK并且GET请求返回预期的302状态代码。

所以我需要做一个GET请求,但我不需要为获取整个HTML文档所需的额外带宽时间付费。任何人都知道一个黑客去做GET而不让身体归还?

更新:接受David的建议去做一个Range标题,但他们似乎仍然无视它

GET /news/url?sa=t&fd=R&usg=AFQjCNGrJk-F7Dmshmtze2yhifxRsv8sRg&url=http://www.mtv.com/news/articles/1647243/20100907/story.jhtml HTTP/1.1
Range: bytes=0-10
x-ms-range: 0-600
Host: news.google.com
Connection: Keep-Alive
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)

HTTP/1.1 302 Moved Temporarily
Content-Type: text/html; charset=UTF-8
Location: http://www.mtv.com/news/articles/1647243/20100907/story.jhtml
Content-Length: 258
Date: Wed, 08 Sep 2010 20:28:16 GMT
Expires: Wed, 08 Sep 2010 20:28:16 GMT
Cache-Control: private, max-age=0
X-Content-Type-Options: nosniff
X-Frame-Options: SAMEORIGIN
X-XSS-Protection: 1; mode=block
Server: GSE
Set-Cookie: PREF=ID=ef5f1bc768645c5e:TM=1283977696:LM=1283977696:S=5n26IrEDpcQTJIb1; expires=Fri, 07-Sep-2012 20:28:16 GMT; path=/; domain=.google.com

<HTML><HEAD><meta http-equiv="content-type" content="text/html;charset=utf-8">
<TITLE>302 Moved</TITLE></HEAD><BODY>
<H1>302 Moved</H1>
The document has moved
<A HREF="http://www.mtv.com/news/articles/1647243/20100907/story.jhtml">here</A>.
</BODY></HTML>

2 个答案:

答案 0 :(得分:0)

1)向网络服务器的所有者提交错误。

2)尝试在请求中使用Range标头。

3)如果这不起作用,您可以在获得所需的标题后挂断连接吗?

答案 1 :(得分:0)

在您引用的具体示例中,您可以将其从原始网址的“url”参数中拉出来。但是对于更通用的方法,我会坚持David M.的建议