python读取excel数据,使用pandas填充缺失值

时间:2018-01-10 09:00:00

标签: python excel python-3.x python-2.7 pandas

table 1 表1:第一张表 table 2 表2:单张纸中的第二张表。

伙计们,我想阅读并填写excel数据的缺失值。但我在单张表中有很多表,如何拆分它并只填充不同表的表数据值。

这是我的代码:

#read excel files
import pandas as pd
import numpy as np

stations_data = pd.read_excel('filename', sheet_name=0, skiprows=6)

#get a data frame with selected columns
FORMAT = ['S.No.', 'YEAR', 'JUNE']
df_selected = stations_data[FORMAT]
for col in FORMAT:
    for idx, rows in df_selected.iterrows():
        if pd.isnull(df_selected.loc[idx,col]):
           df_selected = df_selected.fillna(df_selected.mean())         
print (df_selected)

1 个答案:

答案 0 :(得分:0)

您可以使用pd.read_excel使用关键字参数skiprows从特定表的“正确”行开始,skipfooter停在正确的行。当然,如果表中的行数在将来发生变化,这可能不太实用。也许重新构建excel更容易,每张表有一个表,然后只使用sheetname kwarg。请参阅documentation