我正在尝试按年龄段获取混淆矩阵。因此,我想获取每个年龄段的真实价值和预测价值的子集。 具体来说,这是我的代码(我运行了lightgbm模型,并将预测定义为y_predict):
y_new=np.column_stack((test_age_group,y_test,y_predict))
test_age=pd.DataFrame(y_new, columns=['age_group','test','predict'])
age_group=["21-30", "31-40", "41-50", "51-60","60-80"]
我正在考虑运行一个for循环:对于age_group
中的每个类别,返回其索引并获取相应的y_test
和y_predict
,然后获取混淆矩阵和图。
不确定这是否是一种有效的方法,并且想知道执行上述for循环需要什么功能。
谢谢!
答案 0 :(得分:0)
我现在有一个解决方案:data21_30=test_age[test_age.age_group=='21-30']
欢迎使用更少的代码行来更高效地定义所有数据类别!