伙计们,我想阅读并填写excel数据的缺失值。但我在单张表中有很多表,如何拆分它并只填充不同表的表数据值。
这是我的代码:
#read excel files
import pandas as pd
import numpy as np
stations_data = pd.read_excel('filename', sheet_name=0, skiprows=6)
#get a data frame with selected columns
FORMAT = ['S.No.', 'YEAR', 'JUNE']
df_selected = stations_data[FORMAT]
for col in FORMAT:
for idx, rows in df_selected.iterrows():
if pd.isnull(df_selected.loc[idx,col]):
df_selected = df_selected.fillna(df_selected.mean())
print (df_selected)
答案 0 :(得分:0)
您可以使用pd.read_excel
使用关键字参数skiprows
从特定表的“正确”行开始,skipfooter
停在正确的行。当然,如果表中的行数在将来发生变化,这可能不太实用。也许重新构建excel更容易,每张表有一个表,然后只使用sheetname
kwarg。请参阅documentation。