所以问题出在下面。我有数据框:
0.61.5
对于每个列名,我想删除它的重复列。很难解释。结果数据框应为:
a a b a b
0 0 1 2 1 2
1 3 4 5 4 5
我已经通过drop_duplicates()和df [['column_namee']]的转置实现了每一列,但是它太慢了。
我想知道是否有任何最快的方法来解决它。
答案 0 :(得分:2)
IIUC
df=df.loc[:,~(df.T.duplicated()&df.columns.duplicated())]
Out[184]:
a a b
0 0 1 2
1 3 4 5