使用np.unique()获取数据帧DF的唯一值的索引/反向索引

时间:2019-05-20 12:49:59

标签: python-3.x pandas unique

这是我想应用于数据框的标准示例。

标准示例应用于具有所需输出的数组

import numpy as np

A = np.array([9,2,9,5])

C, ia, ic = np.unique(A, return_index=True, return_inverse=True)  

print(C)
print(ia)
print(ic)

output

[2 5 9]
[1 3 0]
[2, 0, 2, 1]

如何将示例扩展到dataFrame?从概念上讲,我希望获得相同的结果,但要使用具有多列而不是A的数据框。下面的代码对我不起作用。

C, ia, ic = np.unique(DF[['column1', 'column2', 'column3']], return_index=True, return_inverse=True)

我也尝试了以下方法,但是我不确定它是否能给出正确的答案。

C, ia, ic = np.unique(DF[['column1', 'column2', 'column3']].values, return_index=True, return_inverse=True)

任何帮助都超过了欢迎

0 个答案:

没有答案