我尝试根据另一列中的值连接列中的字符串。虽然这本身并不困难,但这里标志的顺序很重要,所以我不能想到一个pythonic方法来完成这个任务(目前正在尝试多个计数器/循环)。
示例表:
text flag
a 0
b 0
c 1
d 0
e 1
f 1
g 1
示例输出:
text flag
ab 0
c 1
d 0
efg 1
我希望''.join
每个字符串用于连续标志,直到下一个标志被击中。唯一的标志是1和0.任何想法?
以下是生成示例数据的快捷方式,因此您无需自行完成:
import pandas as pd
df = pd.DataFrame({'text':['a','b','c','d','e','f','g'], 'flag':[0,0,1,0,1,1,1]})
答案 0 :(得分:3)
我这样做:
In [6]: (df.groupby(df.flag.diff().ne(0).cumsum(), as_index=False)
.agg({'text':'sum','flag':'first'}))
Out[6]:
text flag
0 ab 0
1 c 1
2 d 0
3 efg 1