html5lib抓取和安装时出错

时间:2018-12-11 08:56:57

标签: python web-scraping

我一直在尝试从航班网站上抓取数据。 这是我写的代码:

todays_date = str(date.today())
arrival_filename = todays_date+"Arrival_Data_IGI.csv"
res = requests.get("https://m.newdelhiairport.in/live-flight- 
 information.aspx?FLMode=A&FLType=D")
soup = BeautifulSoup(res.content,'lxml')
table = soup.find_all('table',{'id':'fids_row'})
df = pd.read_html(str(table))
arrival = df[0]
arrival_filename = todays_date+"_Arrival_Data_IGI.csv"
arrival.to_csv(arrival_filename)
arrival.to_csv("Arrival_Data_IGI(daily).csv")

但是我运行代码时出现错误。出现错误:

Error that came

当我尝试使用pip install html5lib安装html5lib时,出现以下错误:

Installation Error

安装任何库或升级pip时出错。

“无法获取URL https://pypi.org/simple/pip/:确认ssl证书时出现问题:HTTPSConnectionPool(host ='pypi.org',port = 443):URL超过了最大重试次数:/ simple / pip /(由SSLError(SSLCertVerificationError(1,'[SSL:CERTIFICATE_VERIFY_FAILED]证书验证失败:证书链中的自签名证书(_ssl.c:1051)'))引起)-跳过“

2 个答案:

答案 0 :(得分:0)

您应该升级pip。此解决方案(来自this github对话)可以解决问题:

python -m pip install --trusted-host pypi.python.org --trusted-host files.pythonhosted.org --trusted-host pypi.org --upgrade pip

答案 1 :(得分:0)

如果使用Windows,则在64位版本上安装软件包时有时可能会出现问题。

您可以从here下载该库的64位版本。

然后在下载文件的路径上打开Command提示符,然后键入

pip install "name of the package".whl

由于下载的文件是wheel文件。

或者您可以从Anaconda-Navigator下载所需的软件包。