从熊猫字符串中提取多个子字符串

时间:2018-10-08 14:51:22

标签: python pandas

我有一个pandas Series,我必须在其中提取括号内的所有子字符串。一个字符串可能包含多个此类子字符串,也可能不包含此类子字符串。如何处理这种情况

abc(def)ghi(jkl)aaa
jklmnopqr(jkl)
(ab)cde(ghi)
lmnoprst uvwxyz

如果使用str.extract,一次只能从带有a.str.extract('.*\((.*)\)')的字符串中获得一个子字符串。因此,实际上,我错过了子字符串def

如何解决??

期望的结果是

def
jkl
ab
ghi

1 个答案:

答案 0 :(得分:2)

尝试:

df[0].str.extractall(r'\((\w+)\)')

输出:

           0
  match     
0 0      def
  1      jkl
1 0      jkl
2 0       ab
  1      ghi