我使用pd.read_html()
从网页导入表格,但不是将数据结构化为数据帧,而是将Python作为列表导入。如何将数据作为数据框导入?谢谢!
代码如下:
import pandas as pd
import html5lib
url = 'http://www.fdic.gov/bank/individual/failed/banklist.html'
dfs = pd.read_html(url)
type(dfs)
Out[1]: list
答案 0 :(得分:7)
.read_html()
生成一个数据框列表(HTML源代码中可能有多个表),通过索引获取所需的数据框。在您的情况下,只有一个数据帧:
dfs = pd.read_html(url)
df = dfs[0]
print(df)
请注意,如果HTML源代码中没有table
,则会返回错误,并且永远不会生成空列表。
答案 1 :(得分:0)
import pandas as pd
import html5lib
url = 'http://www.fdic.gov/bank/individual/failed/banklist.html'
dfs = pd.read_html(url)
df = pd.concat(dfs)
df