应用错误收集

我正在尝试根据症状建立疾病预测因子。我正在使用从Symcat网站抓取的数据。采样数据后，我们将症状映射到疾病以进行培训，数据如下所示： X-> S1，S2，S4 ... Y-> D1，D2，D5 问题在于某些症状是特定疾病的有力预测指标。假设S1是D1的有力预测指标。因此，由于存在S1，因此与其他模型相比，基本上模型应该预测D1的概率得分更高。如何吸收S1是D1的强预测因子的信息，以便将其用于模型训练

试图对那些强有力的疾病组合预测因子进行过采样。但是不要认为这是正确的，因为我有一个多标签数据集。结果也没有反映

如何在模型训练中使用强预测变量？

0 个答案: