从熊猫数据框列中提取列表

时间:2019-11-11 14:50:58

标签: python pandas

我想提取所有在数据框的列中的列表中出现数字的情况

使用它作为示例:

':[{"id":836890 name:"Rob Rubnitz" scorecard:[40 35]} {"id":401538 name:"Steve Weisfeld" scorecard:[40 35]} {"id":799385 name:"Marc Werlinsky" scorecard:[40 35]}] '

我想提取[40 35] [40 35] [40 35]并将其作为出现在更新列中的数字。

这是我尝试过的:

data['col'].str.extract('scorecard:(?P<scorecards>.*?)}')

问题在于,这只会从我的专栏中提取第一个记分卡

1 个答案:

答案 0 :(得分:1)

extractall

data['col'].str.extractall('scorecard:(?P<scorecards>.*?)}')

        scorecards
  match           
0 0        [40 35]
  1        [40 35]
  2        [40 35]

findall

data['col'].str.findall('scorecard:(.*?)}')

0    [[40 35], [40 35], [40 35]]
Name: col, dtype: object