熊猫json规范化语法问题

时间:2020-02-13 21:19:55

标签: python json pandas

这是我的json有效负载的示例:

{'data': 
  [{
    'predictionValues': 
     [
      {'value': 0.9926338328, 'label': 1.0}, 
      {'value': 0.0073661672, 'label': 0.0}
     ], 
    'predictionThreshold': 0.5, 
    'prediction': 1.0, 
    'rowId': 0, 
    'passthroughValues': 
      {'Id': 'AMF012-000272'}
   }, 
   {
    'predictionValues': 
     [
      {'value': 0.446989075, 'label': 1.0}, 
      {'value': 0.553010925, 'label': 0.0}
     ], 
    'predictionThreshold': 0.5, 
    'prediction': 0.0, 
    'rowId': 1, 
    'passthroughValues': 
     {'Id': 'NSF008-000165'}
  }]
}

我正在尝试获得一个看起来像这样的df,似乎无法弄清楚:

passthroughValues.Id predictionValues.Value_1.0 predictionValues.Value_0.0  
AMF012-000272        0.9926338328               0.0073661672  
NSF008-000165        0.446989075                0.553010925

仅在没有任何性能参数的情况下运行是不可行的

df = json_normalize(finalPredictions)

将预测值作为系列返回

df = json_normalize(finalPredictions, ['data', 'PredictionValues'])

仅返回0和1而没有将其关联回我的数据所需的ID

1 个答案:

答案 0 :(得分:0)

找到答案:

result = json_normalize(finalPredictions['data'], 'predictionValues', [['passthroughValues', 'Id']])

我真的只在乎积极的结果

result = result[result['label']==1]