我的数据采用以下格式
NAME SALARY DEPT rank1
Dan 623.3 HR 1
Dan 515.2 HR 0
Dan 611 HR 1
Dan 729 HR 2
Rick 843.25 IT 2
Rick 578 IT 0
Rick 632.8 IT 1
Rick 722.5 IT 1
我想使用多类分类模型来预测等级1。 SALARY和DEPT是我的独立变量。大多数算法使用相对于参考水平而言具有最高概率的类别进行评分。但是,这里我需要所有级别的概率。我还需要通过NAME建立模型,因此训练模型后,每个不同的NAME都会有自己的系数。我可以使用Logistic回归,KNN,朴素贝叶斯或您建议的任何其他算法。我的结果应为得分数据给出每个等级1的概率。当我对新数据进行评分(与训练数据的格式相同)时,我应该获得以下格式的结果
NAME SALARY DEPT rank1_0 rank1_1 rank1_2
Dan 711 HR 0.25 0.6 0.15
Rick 819 IT 0.2 0.3 0.5
Dan 743 HR 0.1 0.2 0.7
Rick 688 IT 0.3 0.3 0.4
第1_0,第1_1和第1_2列的概率分别为0、1和2。
感谢您的帮助!