熊猫:read_html

时间:2016-01-01 09:55:22

标签: python pandas

我试图从维基URL中提取美国各州,并且我正在使用Python Pandas。

import pandas as pd
import html5lib
f_states = pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states') 

但是,上面的代码给了我一个错误L

  

ImportError Traceback(最近一次调用最后一次)    in()         1个导入pandas为pd   ----> 2 f_states = pd.read_html(' https://simple.wikipedia.org/wiki/List_of_U.S._states')

     

如果有味道(' bs4',' html5lib'):       662如果不是_HAS_HTML5LIB:    - > 663引发ImportError(" html5lib未找到,请安装它")       664如果不是_HAS_BS4:       665引发ImportError(" BeautifulSoup4(bs4)未找到,请安装它")   ImportError:找不到html5lib,请安装它

我也安装了html5lib和beautifulsoup4,但它无法正常工作。 有人可以帮忙吗。

5 个答案:

答案 0 :(得分:29)

在mac上运行Python 3.4

新pyvenv

pip install pandas
pip install lxml
pip install html5lib
pip install BeautifulSoup4

然后运行你的例子,它应该工作:

import pandas as pd
import html5lib
f_states=   pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states') 

答案 1 :(得分:2)

另请考虑在https://www.continuum.io/downloads安装所需的包。而不是pip安装,你会conda安装你的包。

$ conda install html5lib 

答案 2 :(得分:0)

您需要使用pip安装lxml。

pip install lxml

这对我有用。

答案 3 :(得分:0)

为此,您只需要安装

pip install pandas
pip install lxml

然后您必须导入它们并运行程序

import pandas as pd
f_states=pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states') 

答案 4 :(得分:0)

如果您的环境是Anaconda Jupiter笔记本。

您需要另一套安装注释:

conda install lxml
conda install html5lib
conda install BeautifulSoup4

然后在Jupiter Notebook中运行python代码。

import pandas as pd
f_states=   pd.read_html('https://simple.wikipedia.org/wiki/List_of_U.S._states')