Accept-Language标头无法按预期工作

时间:2014-12-24 10:50:45

标签: python python-2.7 http-headers urllib2

我使用以下代码请求英文页面并获取树结构:

from urllib2 import Request, urlopen      
req = Request(url)
req.add_header('Accept-Language', 'en-US')
resp = urlopen(req)      
target = lxml.html.parse(resp)

网址=' http://www.imdb.com/ **** /'

该网站仅以英文显示,我认为除了改变语言的电影标题外 由于浏览器语言。

根据显示的代码,我仍然有西班牙语的电影标题,而不是英文。

我尝试使用像tor这样的匿名浏览器进入页面。标题是英文的。

有什么想法我可以用Python完全用英语获取页面吗?

1 个答案:

答案 0 :(得分:0)

问题是我在另一个线程中同时使用了imdbpy库。显然它造成了某种不相容性。

上述代码对于以其他语言请求页面是正确的。