Question

说我有以下数组：

import numpy as np

data = np.array([[51001, 121, 1, 121212],
                 [51001, 121, 1, 125451],
                 [51001, 125, 1, 127653]]

我想仅删除行中前3个元素（前3列）的重复行。

所以我得到的结果是：

print data
[[51001, 121, 1, 121212],
 [51001, 125, 1, 127653]]

只要我通过前3列获得唯一的一行，我们保留哪一行和删除哪一行都无关紧要

Answer 1

这是在pandas中使用drop_duplicates的单向方法

In [179]: pd.DataFrame(data).drop_duplicates([0, 1, 2]).values
Out[179]:
array([[ 51001,    121,      1, 121212],
       [ 51001,    125,      1, 127653]])

Python - 删除部分行的行重复

1 个答案: