整个数据框大约有4万列和10万行。
我设法用代码做某事:
low range = 0
for columns in range(0, len(df.columns), 6000):
idx = df.iloc[:, low_range: columns].T.index.names
df.iloc[:, low_range: columns]= df.iloc[:, low_range: columns].T.reset_index().dropna(inplace=True).set_index(idx).T
low_range = low_range + len(df.iloc[:, low_range: columns])
但是我的问题是,当我使用mulitindex NaN删除列时,我想用新的子集替换这些列(不使用NaN Mulitindex)。现在,我选择了6000列的子集。我知道在dropna()
之后,这个子集会更小。
我很努力替换这个新的子集来代替以前的6000列,并选择一个新的子集来做同样的事情...
任何人都可以帮忙吗?
提前谢谢!
P.S .:我不能只删除诸如df.dropna(axis=1)
之类的列。如果您知道一种更好的方法,那我就太好了!