在没有循环的情况下在数据框中查找唯一值

时间:2014-01-16 11:07:30

标签: python pandas

如何在不循环的情况下在数据框中找到唯一值?

df1 = pd.DataFrame(np.random.randint(0,105673,size=100).reshape(10,10))
df2 = pd.DataFrame(np.random.randint(0,206782,size=100).reshape(10,10))
df3 = pd.DataFrame(np.random.randint(0,435612,size=100).reshape(10,10))

要查找仅使用pd.unique(df1.values.ravel())的一个数据框的唯一值。在循环数据帧时,使用列表附加唯一值会引发内存错误(df1,df2,df3中提到的范围只是一个示例。实际范围可能是数百万)。我该如何处理?

1 个答案:

答案 0 :(得分:0)

您可以尝试通过将其展平值转换为集合df来获取数据框set(df.values.ravel())中的唯一值(在设置数据结构中,将自动删除重复值)。