在熊猫中阅读具有不相等单元尺寸的维京人

时间:2017-12-20 16:32:30

标签: python pandas wikipedia

我正试图从这个维基百科页面阅读wikitables:https://en.wikipedia.org/wiki/Timeline_of_Apple_Inc._products

我使用以下内容:

    import pandas as pd
    page = 'https://en.wikipedia.org/wiki/Timeline_of_Apple_Inc._products'    
    wikitables = pd.read_html(page, attrs={"class":"wikitable"})
    table1 = wikitables[0]    

由于细胞大小不相等(例如,'1979'跨越Apple的多个模型),这会使一些细胞倾斜以填充“空白”细胞并在错误的细胞中引入NaN(例如来自列的值)模型'在'年'列中结束)。

here is a screenshot of the dataframe with skewed values

在阅读HTML时有没有办法解决这个问题?或者另一种方法是一致地填充单元格中的空白区域,以使值不会偏斜?

提前致谢!

0 个答案:

没有答案