我目前正在使用“请求”和“BeautifulSoup”库向网址(http://www.flickr.com/)发出http请求,并从响应html页面中提取数据。
我遇到的问题是,我试图仅从英文版页面中提取数据,但是根据我当前的语言环境返回中文版页面。
有没有办法配置请求的区域设置?就我而言,英语。
提前致谢
答案 0 :(得分:2)
这取决于Flickr如何识别您的语言环境。
如果需要注意在浏览器设置中设置哪种语言,则可能需要在可接受语言列表中包含englich,以便在HTTP规范中定义它。
要做到这一点,请在标题中加入“Accept-Language:en-US”。
例如,如果您使用requests.Session
session = Session()
session.headers.update({"Accept-Language": "en-US"})
... using session variable ...
或者,如果您使用简单请求,请将其更改为:
requests.get(...something..., headers = {"Accept-Language": "en-US"})