到目前为止,我一直没有学习正则表达式,但是我试图弄清楚如何在Series.str.match(expression)
的pandas中使用它来分割一列以创建两个新列。 (我知道我可以在没有正则表达式的情况下做到这一点)
列数据的示例是:
True Grit {' Rooster Cogburn'}
国王的演讲{' King George VI'}
Biutiful {' Uxbal'}
两个分组中每个分组中可以有大于1的任意数量的字符串。如何提取两个组以生成True Grit, Rooster Cogburn
?
答案 0 :(得分:3)
鉴于此数据框
BundleUtilities
将返回
col
0 True Grit {Rooster Cogburn}
1 The King's Speech {King George VI}
2 Biutiful {Uxbal}
df = df.col.str.extract('(.*)\s*{(.*)}', expand = True)