我有一个名为data的列,它具有不同格式的字符串值,如:
55,'first_name','2394234'
'first_name', '2394234'
'124', 'first_name', '2394234'
我需要提取substring first_name。我在SQL上真的很糟糕,但是在python中,提取名字的正则表达式将是这样的:
\'(?P<first_name>[a-zA-Z]{4,})\',\s*\'[0-9]{7}\'
我需要的模式是用''后面跟着的字母的任意组合,之后可以是空格,最后再用''再括几个长度为7的字母。
请提供任何线索。