Question

我有一个重复的数据框。它们位于每行特定数量的列索引中：

df_in

0   1   2    3    4    5    6    7    8    9    10   11   12   13   14   15   16   17   18   19...
1   3   4    6    0    2    0    3    0    2    0    3    4    5    6    2    4    5    6    2...
.
.

在索引row 1的{{1}}中，从索引4-7重复了[0, 2, 0, 3]，然后在索引8-11中，重复了{{1} }来自12-15。

我需要检测每行中的每个[4, 5, 6, 2]是否相等，如果是，则从DataFrame中删除这些重复之一。

输出为：

16-19

伪代码类似于：

4 numbers

有没有简单的方法可以做到这一点？

Answer 1

这似乎是一个疯狂的解决方案。主要思想是使用python的ParentDir/ Chart.yaml requirements.yaml values.yaml charts/ | | —- App1 Chart.yaml values.yaml templates/ —- App2 Chart.yaml values.yaml templates/ . . . —- AppN Chart.yaml values.yaml templates/函数检查重复项：

hash

检查数据框行的各部分在Python中是否相同

1 个答案: