我正在寻找Pandas Data Frame中的非连续字符串重复项。 注意:我已经使用Shift键,但无法获得所需的输出。
Abc
a
a
a
a
bb
bb
bb
a
bb
抄送
抄送
bb
抄送
cc
所需的输出: a bb bb cc
答案 0 :(得分:0)
假设您的预期输出不正确...
df[df['ABC'].shift(-1) != df['ABC']]
ABC
3 aa
6 bb
7 aa
8 bb
10 cc
11 bb
13 cc
答案 1 :(得分:0)
好吧,这是我为此所做的代码。
a = df[df['ABC'].shift(1) != df['ABC']]
b= df.drop_dupicates('ABC')
c = a[~a.isin(b)]
输出:aa bb bb cc