Windows 10上的Python 3.5,32位盒;我想要做的就是运行:
import quandl
import pandas as pd
import html5lib
import lxml
# retrieve web page with list of 50 states
fiddy_states = pd.read_html('https://simple.wikipedia.or /wiki/List_of_U.S._states')
但是对于我的生活,我似乎无法正确安装lxml,这是pd.read_html
所要求的。根据几个在线资源的建议,我在我的系统中安装了MinGW,并且我还在C:\Python35-32\Lib\distutils\distutils.cfg
添加了以下内容:
[build]
compiler=mingw32
我安装了MinGW并包含在PATH
中。我尝试使用pip3以及Unofficial Windows Binaries for Python Extension Packages中找到的二进制文件安装lxml。
以下是所有已安装的软件包:
['beautifulsoup4==4.4.1', 'cffi==1.6.0', 'cryptography==1.3.2', 'cycler==0.10.0', 'cython==0.24', 'html5lib==0.9999999', 'idna==2.1', 'inflection==0.3.1', 'lxml==3.4.4', 'matplotlib==1.5.1', 'more-itertools==2.2', 'ndg-httpsclient==0.4.0', 'numpy==1.11.0', 'pandas-datareader==0.2.1', 'pandas==0.18.1', 'pip==8.1.2', 'pyasn1==0.1.9', 'pycparser==2.14', 'pyopenssl==16.0.0', 'pyparsing==2.1.4', 'python-dateutil==2.5.3', 'pytz==2016.4', 'quandl==3.0.1', 'requests-file==1.4', 'requests==2.10.0', 'scikit-learn==0.17.1', 'setuptools==18.2', 'six==1.10.0']
如上所示,似乎已安装lxml==3.4.4
,但是当我尝试运行包含pd.read_html
的行时,出现以下错误消息:
Traceback (most recent call last):
File "<input>", line 1, in <module>
File "C:\Users\Jose Manuel\AppData\Local\Programs\Python\Python35-32 \lib\site-packages\pandas\io\html.py", line 874, in read_html
parse_dates, tupleize_cols, thousands, attrs, encoding)
File "C:\Users\Jose Manuel\AppData\Local\Programs\Python\Python35-32\lib\site-packages\pandas\io\html.py", line 726, in _parse
parser = _parser_dispatch(flav)
File "C:\Users\Jose Manuel\AppData\Local\Programs\Python\Python35-32\lib\site-packages\pandas\io\html.py", line 685, in _parser_dispatch
raise ImportError("lxml not found, please install it")
ImportError: lxml not found, please install itenter code here
非常感谢您的帮助
答案 0 :(得分:2)
我今天一直在努力解决这个问题。我在stackoverflow.com上的其他地方发现了这个由两部分组成的快速解决方案,当我尝试使用lxml时,python不再抱怨:
我的下载目录是d:\ Downloads。 Python必须位于PATH环境变量中才能进行下一步工作。使用如下命令,更改&#34; D:\ Downloads&#34;到下载目录的路径名。然后,在DOS提示符下键入: