我尝试编写一个简单的刮板来提取github主页的所有html代码,但是我不断收到状态响应代码500(内部服务器错误)
这是我的代码:
from flask import Flask
import requests
from bs4 import BeautifulSoup
app = Flask(__name__)
d = {
"site":"https://github.com"
}
@app.route("/")
def index():
URL = "https://github.com"
page = requests.get(URL)
tree = BeautifulSoup(page.content, "html5lib")
return tree.prettify()
if __name__ == "__main__":
app.run(debug = True)
请问我该如何克服呢?
答案 0 :(得分:0)
一开始尝试代码未在我的计算机上运行。问题未安装依赖性。确保已安装以下软件包(例如,安装pip
)
flask
requests
bs4
html5lib