替换Python中数据框的子集,

时间:2018-10-18 14:59:05

标签: python pandas dataframe multi-index

所以我要删除列,因为我的Multiindex等于NaN:enter image description here

整个数据框大约有4万列和10万行。

我设法用代码做某事:

low range = 0
for columns in range(0, len(df.columns), 6000):
idx = df.iloc[:, low_range: columns].T.index.names
    df.iloc[:, low_range: columns]= df.iloc[:, low_range: columns].T.reset_index().dropna(inplace=True).set_index(idx).T
low_range = low_range + len(df.iloc[:, low_range: columns]) 

但是我的问题是,当我使用mulitindex NaN删除列时,我想用新的子集替换这些列(不使用NaN Mulitindex)。现在,我选择了6000列的子集。我知道在dropna()之后,这个子集会更小。

我很努力替换这个新的子集来代替以前的6000列,并选择一个新的子集来做同样的事情...

任何人都可以帮忙吗?

提前谢谢!

P.S .:我不能只删除诸如df.dropna(axis=1)之类的列。如果您知道一种更好的方法,那我就太好了!

0 个答案:

没有答案