熊猫 - 在熊猫数据框列的括号内获取值

时间:2016-06-20 10:41:32

标签: python regex pandas dataframe parentheses

我的df有两列:

Name    Attr
a(bc)
b(aca)
(cba)

我希望专栏Attr的值在Name列的括号内

Name    Attr
a(bc)   bc
b(aca)  aca
(cba)   cba

我试过了:

df['Attr'] = re.findall('\(.*?\)',df['Name'].astype('str'))
  

TypeError: expected string or buffer

非常感谢任何帮助

1 个答案:

答案 0 :(得分:2)

使用str.extract

df['Attr'] = df['Name'].str.extract(r"\(([A-Za-z]+)\)", expand=False)
print (df)
     Name Attr
0   a(bc)   bc
1  b(aca)  aca
2   (cba)  cba

或者将()添加到regex

df['Attr'] = df['Name'].str.extract(r"\((.*?)\)", expand=False)
print (df)
     Name Attr
0   a(bc)   bc
1  b(aca)  aca
2   (cba)  cba