使用drop_duplicates从数据框中删除重复的列时,我收到一条错误消息。
ValueError: Buffer has wrong number of dimensions (expected 1, got 2)
下面是一个最小的示例(请注意,我在这里没有重复的列名,因为那样的话就不会添加该列,所以我的var1在我的实际数据帧中将被称为var0)
dict1 = [{'var0': 0, 'var1': 0, 'var2': 2},
{'var0': 0, 'var1': 0, 'var2': 4},
{'var0': 0, 'var1': 0, 'var2': 8},
{'var0':0, 'var1': 0, 'var2': 12},]
df = pd.DataFrame(dict1, index=['s1', 's2','s1','s2'])
df.T.drop_duplicates().T
答案 0 :(得分:2)
问题出在索引上,当您转置DataFrame时,您会得到重复的列名,这会弄乱它。见下文
JsonDeserializer