Pandas:根据另一列中的标志在列中连接字符串,直到标志更改为止

时间:2018-06-18 17:04:25

标签: python pandas

我尝试根据另一列中的值连接列中的字符串。虽然这本身并不困难,但这里标志的顺序很重要,所以我不能想到一个pythonic方法来完成这个任务(目前正在尝试多个计数器/循环)。

示例表:

text    flag
a       0
b       0
c       1
d       0
e       1
f       1
g       1

示例输出:

text    flag
ab      0
c       1
d       0
efg     1

我希望''.join每个字符串用于连续标志,直到下一个标志被击中。唯一的标志是1和0.任何想法?

以下是生成示例数据的快捷方式,因此您无需自行完成:

import pandas as pd
df = pd.DataFrame({'text':['a','b','c','d','e','f','g'], 'flag':[0,0,1,0,1,1,1]})

1 个答案:

答案 0 :(得分:3)

我这样做:

In [6]: (df.groupby(df.flag.diff().ne(0).cumsum(), as_index=False)
           .agg({'text':'sum','flag':'first'}))
Out[6]:
  text  flag
0   ab     0
1    c     1
2    d     0
3  efg     1