我想提取所有在数据框的列中的列表中出现数字的情况
使用它作为示例:
':[{"id":836890 name:"Rob Rubnitz" scorecard:[40 35]} {"id":401538 name:"Steve Weisfeld" scorecard:[40 35]} {"id":799385 name:"Marc Werlinsky" scorecard:[40 35]}] '
我想提取[40 35] [40 35] [40 35]并将其作为出现在更新列中的数字。
这是我尝试过的:
data['col'].str.extract('scorecard:(?P<scorecards>.*?)}')
问题在于,这只会从我的专栏中提取第一个记分卡
答案 0 :(得分:1)
extractall
data['col'].str.extractall('scorecard:(?P<scorecards>.*?)}')
scorecards
match
0 0 [40 35]
1 [40 35]
2 [40 35]
findall
data['col'].str.findall('scorecard:(.*?)}')
0 [[40 35], [40 35], [40 35]]
Name: col, dtype: object