我正试图从这个维基百科页面阅读wikitables:https://en.wikipedia.org/wiki/Timeline_of_Apple_Inc._products
我使用以下内容:
import pandas as pd
page = 'https://en.wikipedia.org/wiki/Timeline_of_Apple_Inc._products'
wikitables = pd.read_html(page, attrs={"class":"wikitable"})
table1 = wikitables[0]
由于细胞大小不相等(例如,'1979'跨越Apple的多个模型),这会使一些细胞倾斜以填充“空白”细胞并在错误的细胞中引入NaN(例如来自列的值)模型'在'年'列中结束)。
here is a screenshot of the dataframe with skewed values
在阅读HTML时有没有办法解决这个问题?或者另一种方法是一致地填充单元格中的空白区域,以使值不会偏斜?
提前致谢!