如何修复HTTP错误400:错误请求?

时间:2017-07-12 13:08:42

标签: python python-3.x bad-request

我正在尝试网络抓,这是我的代码。

出于某种原因,我收到HTTP错误400:错误的请求,我以前从未有过。

有什么想法吗?

这是我的代码:

import urllib.request
import re

url = ('https://www.myvue.com/whats-on')

req = urllib.request.Request(url, headers={'User Agent': 'Mozilla/5.0'})

def main():

    html_page = urllib.request.urlopen(req).read()

    content=html_page.decode(errors='ignore', encoding='utf-8')

    headings = re.findall('<th scope="col" abbr="(.*?)">', content)

    print(headings)

main()

1 个答案:

答案 0 :(得分:7)

修正标题:

req = urllib.request.Request(url, headers={'User-Agent': 'Mozilla/5.0'})

它是User-Agent,而不是User Agent

此外,我建议切换到requests模块。

html_page = requests.get(url, {'User-Agent': 'Mozilla/5.0'}).text

这相当于三行urllib,更具可读性。此外,它会自动为您解码内容。