我使用pd.read_html尝试导入表,但是运行它时却得到了一个长字符串。有没有一种简单的方法可以将结果的格式更改为每行1个单词,而不是一个长字符串,或者我应该使用pd.read_html以外的函数?谢谢!
这是我的代码:
import requests
import pandas as pd
url ='http://www.linfo.org/acronym_list.html'
dfs = pd.read_html(url, header =0)
df = pd.concat(dfs)
df
我也使用了它,并得到了相同的结果:
import pandas as pd
url ='http://www.linfo.org/acronym_list.html'
data = pd.read_html(url, header=0)
data[0]
出[1]:
ABCDEFGHIJKLMNOPQRSTUVWXYZ A AMD高级设备API应用程序编程接口ARP地址解析协议ARPANET高级研究计划局网络AS自治系统ASCII美国信息交换标准代码AT&T美国电话电报公司ATA先进技术附件ATM异步传输模式BB字节BELUG Bellevue Linux用户组BGP边界网关协议...
答案 0 :(得分:0)
问题在于如何在此站点中创建表。
根据https://www.w3schools.com/html/html_tables.asp,用
标记定义的。默认情况下,表标题为粗体和居中。表数据/单元格用 | 标签定义。
如果按CTRL + SHIFT + I,则可以检查站点的html元素,您将看到此站点不符合此标准。这就是为什么您无法使用pandas.read_html获取正确的数据框。
相关问题
最新问题
|
---|