我试图将不以特定字符('[')开头的行连接到以它开头的最近行。我已阅读以下txt文件:
,
我希望得到
。
答案 0 :(得分:0)
让我们这样做
s=df.groupby(df.text.str.startswith('[').cumsum()).agg(' ',join)
答案 1 :(得分:0)
您可以使用str[0]
检查第一个字符,然后使用cumsum
标记块:
df['text'].groupby(df['text'].str[0].eq('[').cumsum()).agg(' '.join)
输出:
text
1 [aaa] sss
2 [bbb] mmm fff ppp
3 [iii] rrr qqq
4 [ggg] kkk
Name: text, dtype: object