即使在' User-Agent'中使用垃圾值,代码也能完美运行。参数

时间:2016-10-20 11:35:42

标签: python urllib user-agent

虽然我已将垃圾值放入User-Agent参数中,但我的以下代码运行完美。我一直在努力通过尝试不同的User-Agent参数来解决我的爬行问题,只是为了最终实现基于以下程序,User-Agent参数似乎对我的程序没有任何影响。怎么会这样呢?

系统:Ubuntu 16.04,python 3.5

import urllib.request
req = urllib.request.Request('http://example.com', headers = {'User-Agent': "junkvalues-dsfafew"})
x = urllib.request.urlopen(req)      # open the url
sourceCode = x.read() # get the source code
print (str(sourceCode))

1 个答案:

答案 0 :(得分:0)

请求结束时绝对没有任何关注用户代理的事情。它可以为您提供服务的服务器带来好处:它可能希望收集有关其访问者使用的浏览器的统计信息,或者可能为旧版浏览器提供替代版本的页面。 39; t支持普通页面所需的一些新技术。服务器可能会拒绝使用无法识别的用户代理的请求,但这通常是一个坏主意,因为它会使网站无法使用不常见的浏览器或浏览器比网站更新为......编程。