我使用以下代码验证我的用户代理ID以访问网页:
url = 'http://...'
user_agent = 'Mozilla/20.0.1 (compatible; MSIE 5.5; Windows NT)'
headers = {'User-Agent':user_agent}
req = urllib2.Request(url, headers=headers)
response = urllib2.urlopen(req)
但是,我现在正在使用Ubuntu,如何更改user_agent
变量以匹配linux标准?
答案 0 :(得分:0)
以下是适用于Linux的Chrome用户代理示例:
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/507.12
(KHTML, like Gecko) Chrome/25.31.00.00 Safari/507.12
Ubuntu上的Firefox用户代理:
Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:21.0) Gecko/20100001
这是Linux上的命令行浏览器用户代理。
Lynx/2.8.8dev.3 libwww-FM/2.14 SSL-MM/1.4.1
他们真的不那么严格。要使用最安全的用户代理(从成功的角度来看)是Chrome或Firefox,但请务必遵守robots.txt文件。
答案 1 :(得分:0)
此网站可能有帮助。
http://www.useragentstring.com/pages/useragentstring.php
您可以选择支持Linux的浏览器,然后找到包含“linux”的“User-Agent”。