我有一个pandas Series
,我必须在其中提取括号内的所有子字符串。一个字符串可能包含多个此类子字符串,也可能不包含此类子字符串。如何处理这种情况
abc(def)ghi(jkl)aaa
jklmnopqr(jkl)
(ab)cde(ghi)
lmnoprst uvwxyz
如果使用str.extract
,一次只能从带有a.str.extract('.*\((.*)\)')
的字符串中获得一个子字符串。因此,实际上,我错过了子字符串def
。
如何解决??
期望的结果是
def
jkl
ab
ghi
答案 0 :(得分:2)
尝试:
df[0].str.extractall(r'\((\w+)\)')
输出:
0
match
0 0 def
1 jkl
1 0 jkl
2 0 ab
1 ghi