Pandas从excel表中删除数据缺失

时间:2015-03-16 04:22:23

标签: python pandas

我正在尝试连接一些我从excel读取并使用pandas进行旋转(堆叠)的表。下面的代码完美地工作,除了最后的数据帧(GRL)缺少最后两列。这些列对应于输入excel文件中的列,这些列具有多个空单元格作为第一个条目。我已经尝试在数据子集(和测试数据)上使用concat,它似乎可以工作,但不适用于整个数据集。似乎pd.concat没有在日期时间索引上使用联合,其中列以缺少的数据开始。

有人能在这里发现一个明显的错误吗?感谢。

path = 'C:\\dr\\'
WQ_file = 'File.xlsx'

xl = pd.ExcelFile(path + WQ_file)
sheet_names = xl.sheet_names

GRL = pd.read_excel(path + WQ_file, sheetname = sheet_names[0], parse_cols = 15, index_col = 0, na_values = ['', 'na'])
GRL = GRL.stack(dropna=False).reorder_levels([1,0]).sortlevel(0)
GRL.name = sheet_names[0]

for n in sheet_names[1:-1]:
    df1 = pd.read_excel(path + WQ_file, sheetname = n, parse_cols = 15, index_col = 0, na_values = ['', 'na'])
    df1 = df1.stack(dropna=False).reorder_levels([1,0]).sortlevel(0)
    df1.name = n
    GRL = pd.concat([GRL, df1], axis = 1)
GRL.columns.name = 'Locations'
GRL

1 个答案:

答案 0 :(得分:0)

这实际上有效。所以没有问题。谢谢