熊猫数据帧的unique()奇怪的错误

时间:2020-05-01 01:01:46

标签: python pandas dataframe unique

不幸的是,我无法生成一个可复制的示例,但这是我遇到的问题-对于一个数据帧,我能够遍历各列并保存每列的唯一值计数。对于另一个数据框,它具有与第一个数据框完全相同的列和数据-唯一的区别是第二个数据框都是对象dtype,而第一个数据集具有整数和浮点数-我遇到了“无法散列的类型:'dict”错误。

这有效:

for col in olddf.columns:
    unique = len(olddf[col].unique())
    print(col, unique)

我得到一个无法散列的类型:“ dict”错误,内容如下:

for col in orig_results.columns:
    unique = len(orig_results[col].unique())

就像我提到的那样,不幸的是,我无法提出要复制的样本数据集。想知道是否有人对可能发生的事情有一个大致的了解?谢谢!

enter image description here

1 个答案:

答案 0 :(得分:0)

原来是location列引发错误,其中包含字典作为值:{'latitude':'40 .7388739110531','longitude':'40 .738873911'}。由于字典是不可散列的,因此我们无法获得唯一的计数。