Question

我的数据采用以下格式

      NAME             SALARY                DEPT           rank1
      Dan                 623.3              HR                1
      Dan                 515.2              HR                0
      Dan                 611                HR                1
      Dan                 729                HR                2
      Rick                843.25             IT                2
      Rick                578                IT                0
      Rick                632.8              IT                1
      Rick                722.5              IT                1

我想使用多类分类模型来预测等级1。 SALARY和DEPT是我的独立变量。大多数算法使用相对于参考水平而言具有最高概率的类别进行评分。但是，这里我需要所有级别的概率。我还需要通过NAME建立模型，因此训练模型后，每个不同的NAME都会有自己的系数。我可以使用Logistic回归，KNN，朴素贝叶斯或您建议的任何其他算法。我的结果应为得分数据给出每个等级1的概率。当我对新数据进行评分（与训练数据的格式相同）时，我应该获得以下格式的结果

      NAME         SALARY             DEPT     rank1_0   rank1_1    rank1_2   
      Dan          711                HR        0.25        0.6    0.15   
      Rick         819                IT        0.2         0.3     0.5
      Dan          743                HR        0.1         0.2     0.7
      Rick         688                IT        0.3         0.3     0.4

第1_0，第1_1和第1_2列的概率分别为0、1和2。

感谢您的帮助！

在SAS中的多类别分类问题中为每个类别生成概率

0 个答案: