引用列表列表中的列表

时间:2016-04-17 23:07:40

标签: python function pandas iteration

我有2个数据帧 用于评分学生分数的一分卡 第二个单学生数据集。

我想在给定的学生数据集上应用记分卡来计算分数并汇总它们。我正在尝试开发一个通用函数 记分卡并适用于任何学生标记数据集

import pandas as pd
score_card_data = {
        'subject_id': ['MATHS', 'SCIENCE', 'ARTS'],
        'bin_list': [[0,25,50,75,100], [0,20,40,60,80,100], [0,20,40,60,80,100]], 
        'bin_value': [[1,2,3,4], [1,2,3,4,5], [3,4,5,6,7] ]}
score_card_data = pd.DataFrame(score_card_data, columns = ['subject_id', 'bin_list', 'bin_value'])
score_card_data

student_scores = {
        'STUDENT_ID': ['S1', 'S2', 'S3','S4','S5'],
        'MATH_MARKS': [10,15,25,65,75], 
        'SCIENCE_MARKS': [8,15,20,35,85],
        'ARTS_MARKS':[55,90,95,88,99]}
student_scores = pd.DataFrame(student_scores, columns = ['STUDENT_ID', 'MATH_MARKS', 'SCIENCE_MARKS','ARTS_MARKS'])
student_scores

功能 定义箱子 在列上应用箱子

bins = list(score_card_data.loc[score_card_data['subject_id'] == 'MATHS', 'bin_list'])
student_scores['MATH_SCORE'] = pd.cut(student_scores['MATH_MARKS'],bins, labels='MATHS_MARKS')

Error:ValueError: object too deep for desired array

我正在尝试将cellvalue转换为字符串,并将其作为对象进行检测。任何解决方法

如何使该功能更通用?

由于 彩

1 个答案:

答案 0 :(得分:0)

您可以使用bins[0]提取list,否则会提升ValueError

bins[0]
[0, 25, 50, 75, 100]

type(bins[0])
<class 'list'>

student_scores['MATH_SCORE'] = pd.cut(student_scores['MATH_MARKS'], bins[0])

  STUDENT_ID  MATH_MARKS  SCIENCE_MARKS  ARTS_MARKS MATH_SCORE
0         S1          10              8          55    (0, 25]
1         S2          15             15          90    (0, 25]
2         S3          25             20          95    (0, 25]
3         S4          65             35          88   (50, 75]
4         S5          75             85          99   (50, 75]

我遗漏了labels,因为你需要提供四个标签的列表,因为有五个截止/ bin边缘。