用户代理访问Linux中的站点Python

时间:2013-08-16 02:58:23

标签: python urllib

我使用以下代码验证我的用户代理ID以访问网页:

url = 'http://...'
user_agent = 'Mozilla/20.0.1 (compatible; MSIE 5.5; Windows NT)'
headers = {'User-Agent':user_agent}

req = urllib2.Request(url, headers=headers)
response = urllib2.urlopen(req)

但是,我现在正在使用Ubuntu,如何更改user_agent变量以匹配linux标准?

2 个答案:

答案 0 :(得分:0)

以下是适用于Linux的Chrome用户代理示例:

Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/507.12 
(KHTML, like Gecko) Chrome/25.31.00.00 Safari/507.12

Ubuntu上的Firefox用户代理:

Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:21.0) Gecko/20100001

这是Linux上的命令行浏览器用户代理。

Lynx/2.8.8dev.3 libwww-FM/2.14 SSL-MM/1.4.1

他们真的不那么严格。要使用最安全的用户代理(从成功的角度来看)是Chrome或Firefox,但请务必遵守robots.txt文件。

答案 1 :(得分:0)

此网站可能有帮助。

http://www.useragentstring.com/pages/useragentstring.php

您可以选择支持Linux的浏览器,然后找到包含“linux”的“User-Agent”。