寻找非连续副本的Python熊猫

时间:2018-11-04 17:52:29

标签: python pandas

我正在寻找Pandas Data Frame中的非连续字符串重复项。 注意:我已经使用Shift键,但无法获得所需的输出。

Abc
a a a a bb bb bb a bb 抄送 抄送 bb 抄送 cc

所需的输出: a bb bb cc

2 个答案:

答案 0 :(得分:0)

假设您的预期输出不正确...

df[df['ABC'].shift(-1) != df['ABC']]

    ABC
3   aa
6   bb
7   aa
8   bb
10  cc
11  bb
13  cc

答案 1 :(得分:0)

好吧,这是我为此所做的代码。

a = df[df['ABC'].shift(1) != df['ABC']]
b= df.drop_dupicates('ABC')
c = a[~a.isin(b)]

输出:aa bb bb cc