Urllib.request.urlopen()。read不起作用

时间:2019-04-27 16:44:04

标签: python-3.x

最后一行代码给出了错误。

import re
import urllib.request
url="https://www.google.com/search?q=google&tbm=fin#scso=_GYPEXIHYJs6gtQXFn7i4Aw2:0"
data=urllib.request.urlopen(url).read()
  

url =“ https://www.google.com/search?q=google&tbm=fin#scso=_GYPEXIHYJs6gtQXFn7i4Aw2:0”   data = urllib.request.urlopen(url).read()   追溯(最近一次通话):     文件“”,第1行,位于       data = urllib.request.urlopen(url).read()     urlopen中的文件“ C:\ Users \ SHARM \ AppData \ Local \ Programs \ Python \ Python37-32 \ lib \ urllib \ request.py”,第222行       返回opener.open(URL,数据,超时)     打开的文件“ C:\ Users \ SHARM \ AppData \ Local \ Programs \ Python \ Python37-32 \ lib \ urllib \ request.py”,第531行       响应= meth(req,响应)     文件“ C:\ Users \ SHARM \ AppData \ Local \ Programs \ Python \ Python37-32 \ lib \ urllib \ request.py”,第641行,位于http_response中       'http',请求,响应,代码,msg,hdr)     文件“ C:\ Users \ SHARM \ AppData \ Local \ Programs \ Python \ Python37-32 \ lib \ urllib \ request.py”,第569行,错误       返回self._call_chain(* args)     _call_chain中的文件“ C:\ Users \ SHARM \ AppData \ Local \ Programs \ Python \ Python37-32 \ lib \ urllib \ request.py”,第503行       结果= func(* args)     文件“ C:\ Users \ SHARM \ AppData \ Local \ Programs \ Python \ Python37-32 \ lib \ urllib \ request.py”,第649行,位于http_error_default中       引发HTTPError(req.full_url,code,msg,hdrs,fp)   urllib.error.HTTPError:HTTP错误403:禁止

我要打开网址。当我手动打开网址时。我不明白为什么会收到此错误,此错误是什么意思?

1 个答案:

答案 0 :(得分:0)

HTTP Error 403: Forbidden错误可能是由于远程服务器安全性导致阻止bot用户代理所致,更改用户代理标头将解决此错误。

from urllib.request import Request, urlopen

url="https://www.google.com/search?q=google&tbm=fin#scso=_GYPEXIHYJs6gtQXFn7i4Aw2:0" 
req = Request(url, headers={'User-Agent': 'Mozilla/5.0'})
data=urlopen(req).read()