我有以下数据框df
col1 col2 col3
a b a b a b
1 ...
2
3
并且无法弄清楚如何只丢弃一个单独的'例如, df.col1.a
我可以df.col1.drop('a', axis=1)
,但是像df.col1=df.col1.drop('a', axis=1)
那样重新分配失败。
我理解的逻辑结构df.colums
,但我该如何修改呢?
答案 0 :(得分:5)
Drop是一种非常灵活的方法,有很多方法可以使用它:
In [11]: mi = pd.MultiIndex.from_product([['col1', 'col2', 'col3'], ['a', 'b']])
In [12]: df = pd.DataFrame(1, index=[0], columns=mi)
In [13]: df
Out[13]:
col1 col2 col3
a b a b a b
0 1 1 1 1 1 1
使用元组删除单个列:
In [14]: df.drop(('col1', 'a'), axis=1)
Out[14]:
col1 col2 col3
b a b a b
0 1 1 1 1 1
或使用元组列表的列表:
In [15]: df.drop([('col1', 'a'), ('col2', 'b')], axis=1)
Out[15]:
col1 col2 col3
b a a b
0 1 1 1 1
或跨越某个级别,例如所有a
s:
In [16]: df.drop('a', level=1, axis=1)
Out[16]:
col1 col2 col3
b b b
0 1 1 1
在0.14中,您还可以传递要丢弃的正则表达式...
还有一种方法可以删除索引/列的整个级别:
In [21]: df.columns.droplevel(1)
Out[21]: Index([u'col1', u'col1', u'col2', u'col2', u'col3', u'col3'], dtype='object')