检查数据框行的各部分在Python中是否相同

时间:2019-05-13 18:55:08

标签: python python-3.x pandas dataframe duplicates

我有一个重复的数据框。它们位于每行特定数量的列索引中:

df_in

0   1   2    3    4    5    6    7    8    9    10   11   12   13   14   15   16   17   18   19...
1   3   4    6    0    2    0    3    0    2    0    3    4    5    6    2    4    5    6    2...
.
.

在索引row 1的{​​{1}}中,从索引4-7重复了[0, 2, 0, 3],然后在索引8-11中,重复了{{1} }来自12-15

我需要检测每行中的每个[4, 5, 6, 2]是否相等,如果是,则从DataFrame中删除这些重复之一。

输出为:

16-19

伪代码类似于:

4 numbers

有没有简单的方法可以做到这一点?

1 个答案:

答案 0 :(得分:0)

这似乎是一个疯狂的解决方案。主要思想是使用python的ParentDir/ Chart.yaml requirements.yaml values.yaml charts/ | | —- App1 Chart.yaml values.yaml templates/ —- App2 Chart.yaml values.yaml templates/ . . . —- AppN Chart.yaml values.yaml templates/ 函数检查重复项:

hash