我想在使用urllib2.urlopen(..)时在我的请求中发送自定义“Accept”标头。我该怎么做?
答案 0 :(得分:122)
不完全。创建Request
对象实际上并不发送请求,而Request对象没有Read()
方法。 (另外:read()
是小写的。)您需要做的就是将Request
作为第一个参数传递给urlopen()
,这将为您提供答案。
import urllib2
request = urllib2.Request("http://www.google.com", headers={"Accept" : "text/html"})
contents = urllib2.urlopen(request).read()
答案 1 :(得分:15)
我通常使用:
import urllib2
request_headers = {
"Accept-Language": "en-US,en;q=0.5",
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:40.0) Gecko/20100101 Firefox/40.0",
"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
"Referer": "http://thewebsite.com",
"Connection": "keep-alive"
}
request = urllib2.Request("https://thewebsite.com", headers=request_headers)
response = urllib2.urlopen(request).read()
print(response)
答案 2 :(得分:2)
除了已经提到的其他解决方案之外,您还可以使用add_header
方法。
所以py @pantsgolem提供的例子将是:
import urllib2
request = urllib2.Request("http://www.google.com")
request.add_header('Accept','text/html')
##Show the header having the key 'Accept'
request.get_header('Accept')
response = urllib2.urlopen(request)
response.read()