我正在研究网页抓取,但是代码显示错误。我该如何解决?
我已经安装了与BeautifulSoup相关的所有必需软件包。
import request
from bs4 import BeautifulSoup
page = request.GET('https://en.wikipedia.org//wiki//Beautiful_Soup_(HTML_parser)')
soup = BeautifulSoup(page.content, 'html.parser')
print(soup)
我希望网站的HTML,但显示的是:
page = request.GET('https://en.wikipedia.org//wiki//Beautiful_Soup_(HTML_parser)')
TypeError: 'dict' object is not callable
答案 0 :(得分:3)
我认为代码应该
import requests
from bs4 import BeautifulSoup
page = requests.get('https://en.wikipedia.org//wiki//Beautiful_Soup_(HTML_parser)')
soup = BeautifulSoup(page.content,'html.parser')
print(soup)
至少这对我有用(Python 3.6)。
注释中的建议requests
是用于HTTP调用的Python规范包,request
是Flask
内的一个用于访问http调用参数的子包。
答案 1 :(得分:0)
import requests
from bs4 import BeautifulSoup
page = requests.get('https://en.wikipedia.org//wiki//Beautiful_Soup_(HTML_parser)')
soup = BeautifulSoup(page.content, 'html.parser')
page = soup.prettify()
print(page)
requests
是用于HTTP调用的Python规范包,并且
request
是Flask内的一个子程序包,用于访问HTTP调用参数。