我使用以下代码请求英文页面并获取树结构:
from urllib2 import Request, urlopen
req = Request(url)
req.add_header('Accept-Language', 'en-US')
resp = urlopen(req)
target = lxml.html.parse(resp)
网址=' http://www.imdb.com/ **** /'
该网站仅以英文显示,我认为除了改变语言的电影标题外 由于浏览器语言。
根据显示的代码,我仍然有西班牙语的电影标题,而不是英文。
我尝试使用像tor这样的匿名浏览器进入页面。标题是英文的。
有什么想法我可以用Python完全用英语获取页面吗?
答案 0 :(得分:0)
问题是我在另一个线程中同时使用了imdbpy库。显然它造成了某种不相容性。
上述代码对于以其他语言请求页面是正确的。