Question

我试图将不以特定字符（'['）开头的行连接到以它开头的最近行。我已阅读以下txt文件：

start df ，

我希望得到

end df 。

Answer 1

让我们这样做

s=df.groupby(df.text.str.startswith('[').cumsum()).agg(' ',join)

Answer 2

您可以使用str[0]检查第一个字符，然后使用cumsum标记块：

df['text'].groupby(df['text'].str[0].eq('[').cumsum()).agg(' '.join)

输出：

text
1            [aaa] sss
2    [bbb] mmm fff ppp
3        [iii] rrr qqq
4            [ggg] kkk
Name: text, dtype: object