我正在尝试抓取票务网站,以便在有新票可用时通知节日(注意:我不是在尝试通过自动化非法购买此票)。
from urllib.request import Request, urlopen
from bs4 import BeautifulSoup
import urllib.request
req = urllib.request.Request('http://www.moshtix.com.au/v2/event/splendour-in-the-grass/103360', headers={'User-Agent': 'Mozilla/5.0'})
html = urllib.request.urlopen(req).read()
print(html)
,这是以下错误:
lib/python3.7/urllib/request.py", line 649, in http_error_default
raise HTTPError(req.full_url, code, msg, hdrs, fp)
urllib.error.HTTPError: HTTP Error 403: Forbidden
我尝试使用相关问题的答案以及相同的错误代码,但是都失败了。
答案 0 :(得分:0)
使用更完整的用户代理,如果用户代理与已知的“真实”用户代理不匹配,许多网站将阻止漫游器。
尝试
headers={'User-Agent': 'User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.89 Safari/537.36'}