应用错误收集

我正试图从这个维基百科页面阅读wikitables：https://en.wikipedia.org/wiki/Timeline_of_Apple_Inc._products

我使用以下内容：

    import pandas as pd
    page = 'https://en.wikipedia.org/wiki/Timeline_of_Apple_Inc._products'    
    wikitables = pd.read_html(page, attrs={"class":"wikitable"})
    table1 = wikitables[0]

由于细胞大小不相等（例如，'1979'跨越Apple的多个模型），这会使一些细胞倾斜以填充“空白”细胞并在错误的细胞中引入NaN（例如来自列的值）模型'在'年'列中结束）。

here is a screenshot of the dataframe with skewed values

在阅读HTML时有没有办法解决这个问题？或者另一种方法是一致地填充单元格中的空白区域，以使值不会偏斜？

提前致谢！

在熊猫中阅读具有不相等单元尺寸的维京人

0 个答案: