如何在不循环的情况下在数据框中找到唯一值?
df1 = pd.DataFrame(np.random.randint(0,105673,size=100).reshape(10,10))
df2 = pd.DataFrame(np.random.randint(0,206782,size=100).reshape(10,10))
df3 = pd.DataFrame(np.random.randint(0,435612,size=100).reshape(10,10))
要查找仅使用pd.unique(df1.values.ravel())
的一个数据框的唯一值。在循环数据帧时,使用列表附加唯一值会引发内存错误(df1,df2,df3中提到的范围只是一个示例。实际范围可能是数百万)。我该如何处理?
答案 0 :(得分:0)
您可以尝试通过将其展平值转换为集合df
来获取数据框set(df.values.ravel())
中的唯一值(在设置数据结构中,将自动删除重复值)。