Question

到目前为止，我一直没有学习正则表达式，但是我试图弄清楚如何在Series.str.match(expression)的pandas中使用它来分割一列以创建两个新列。（我知道我可以在没有正则表达式的情况下做到这一点）

列数据的示例是：

True Grit {＆＃39; Rooster Cogburn＆＃39;}

国王的演讲{＆＃39; King George VI＆＃39;}

Biutiful {＆＃39; Uxbal＆＃39;}

两个分组中每个分组中可以有大于1的任意数量的字符串。如何提取两个组以生成True Grit, Rooster Cogburn？

Answer 1

鉴于此数据框

BundleUtilities

将返回

    col
0   True Grit {Rooster Cogburn}
1   The King's Speech {King George VI}
2   Biutiful {Uxbal}

df = df.col.str.extract('(.*)\s*{(.*)}', expand = True)

熊猫正则表达式分裂了角色和群体

1 个答案: