删除重复的熊猫数据框

时间:2018-07-22 23:36:35

标签: python pandas duplicates

使用drop_duplicates从数据框中删除重复的列时,我收到一条错误消息。

ValueError: Buffer has wrong number of dimensions (expected 1, got 2)

下面是一个最小的示例(请注意,我在这里没有重复的列名,因为那样的话就不会添加该列,所以我的var1在我的实际数据帧中将被称为var0)

dict1 = [{'var0': 0, 'var1': 0, 'var2': 2},
         {'var0': 0, 'var1': 0, 'var2': 4},
         {'var0': 0, 'var1': 0, 'var2': 8},
         {'var0':0, 'var1': 0, 'var2': 12},]
df = pd.DataFrame(dict1, index=['s1', 's2','s1','s2'])
df.T.drop_duplicates().T

1 个答案:

答案 0 :(得分:2)

问题出在索引上,当您转置DataFrame时,您会得到重复的列名,这会弄乱它。见下文

JsonDeserializer