我有以下代码(在PyCharm(MacOS)中):
import pandas as pd
fiddy_states = pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states')
print(fiddy_states)
我收到以下错误:
/Library/Frameworks/Python.framework/Versions/3.6/bin/python3.6 /Users/user_name/PycharmProjects/PandasTest/Doc3.py
Traceback (most recent call last):
File "/Users/user_name/PycharmProjects/PandasTest/Doc3.py", line 9, in <module>
fiddy_states = pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states')
File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/pandas/io/html.py", line 906, in read_html
keep_default_na=keep_default_na)
File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/pandas/io/html.py", line 733, in _parse
parser = _parser_dispatch(flav)
File "/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/site-packages/pandas/io/html.py", line 693, in _parser_dispatch
raise ImportError("lxml not found, please install it")
ImportError: lxml not found, please install it
在Anaconda中确实安装了最新版本的lxml
(3.8.0
)。尽管如此,我还是尝试通过以下方式重新安装: 1)编写pip install lxml
和 2)下载与我的python版本对应的lxml
轮(lxml-3.8.0-cp36-cp36m-win_amd64.whl
),但在任何情况下都保持不变(在第二种情况下,我得到它是not a supported wheel on this platform
,即使python的版本是正确的(3.6,64位))。
我在这里读过类似的问题(即使是上面的相同代码,因为它来自教程),但问题仍然存在。
答案 0 :(得分:5)
基于以下错误:
/Library/Frameworks/Python.framework/Versions/3.6/bin/python3.6
这意味着您正在使用python-3.6。现在,python-3.x的包管理器通常是pip3
。所以你可能应该安装它:
pip3 install lxml
答案 1 :(得分:2)
对于使用 Jupyter notebook 到达这里的人,我在 pip install lxml
之后重新启动了内核,错误消失了。
答案 2 :(得分:1)
我遇到了同样的错误,看来我的python3指向了python2中的熊猫(因为我没有在python3中安装熊猫)。完成pip3安装熊猫并重新启动笔记本后,它工作正常。
答案 3 :(得分:1)
好吧,这对我有用:
您可能需要(重新)安装一些库pip install lxml bs4 html5lib
pd.read_html()
默认使用 'lxml' 库读取,因此请尝试上面安装的另一个库,如 pd.read_html(some_url, flavor='html5lib')
答案 4 :(得分:1)
我尝试重新安装 lxml
,但没有任何进展。
我结束了卸载熊猫并重新安装和更新,这解决了我的问题!
pip uninstall pandas
pip install pandas
pip3 install --upgrade pandas
答案 5 :(得分:0)
您可以转到“设置”>“项目解释器”>单击“ +”图标
从软件包列表中找到“ lxml”,然后单击下面的“安装软件包”按钮。
我正在使用PyCharm 2019.2.1(社区版)
内部版本#PC-192.6262.63,建于2019年8月22日
运行时版本:11.0.3 + 12-b304.39 amd64
VM:JetBrains s.r.o
的OpenJDK 64位服务器VM
Linux 4.15.0-58-generic
GC:ParNew,ConcurrentMarkSweep
内存:937M
核心:4