熊猫正则表达式分裂了角色和群体

时间:2017-05-24 18:28:30

标签: regex pandas split regex-group

到目前为止,我一直没有学习正则表达式,但是我试图弄清楚如何在Series.str.match(expression)的pandas中使用它来分割一列以创建两个新列。 (我知道我可以在没有正则表达式的情况下做到这一点)

列数据的示例是:

  

True Grit {' Rooster Cogburn'}

     

国王的演讲{' King George VI'}

     

Biutiful {' Uxbal'}

两个分组中每个分组中可以有大于1的任意数量的字符串。如何提取两个组以生成True Grit, Rooster Cogburn

1 个答案:

答案 0 :(得分:3)

鉴于此数据框

BundleUtilities

将返回

    col
0   True Grit {Rooster Cogburn}
1   The King's Speech {King George VI}
2   Biutiful {Uxbal}

df = df.col.str.extract('(.*)\s*{(.*)}', expand = True)