我的df
有两列:
Name Attr
a(bc)
b(aca)
(cba)
我希望专栏Attr
的值在Name
列的括号内
Name Attr
a(bc) bc
b(aca) aca
(cba) cba
我试过了:
df['Attr'] = re.findall('\(.*?\)',df['Name'].astype('str'))
TypeError: expected string or buffer
非常感谢任何帮助
答案 0 :(得分:2)
使用str.extract
:
df['Attr'] = df['Name'].str.extract(r"\(([A-Za-z]+)\)", expand=False)
print (df)
Name Attr
0 a(bc) bc
1 b(aca) aca
2 (cba) cba
或者将()
添加到regex
:
df['Attr'] = df['Name'].str.extract(r"\((.*?)\)", expand=False)
print (df)
Name Attr
0 a(bc) bc
1 b(aca) aca
2 (cba) cba