是否存在将其识别为正在访问它的脚本的网站,尽管我更改了User-Agent标头,我认为这样并且出错。
import urllib,urllib2
req_headers = {'User-Agent':'Mozilla/5.0'}
req = urllib2.Request(url,headers = req_headers)
html = req.open(url)
如果是,那怎么样?
答案 0 :(得分:0)
首先,您的用户代理非常不完整,很容易被检测为假的。
我在回答Hunting cheaters in a voting competition时描述了一些机器人检测技术。
答案 1 :(得分:0)