如何在模型训练中使用强预测变量?

时间:2019-07-19 07:55:42

标签: analytics data-science feature-selection

我正在尝试根据症状建立疾病预测因子。我正在使用从Symcat网站抓取的数据。采样数据后,我们将症状映射到疾病以进行培训,数据如下所示: X-> S1,S2,S4 ... Y-> D1,D2,D5 问题在于某些症状是特定疾病的有力预测指标。假设S1是D1的有力预测指标。因此,由于存在S1,因此与其他模型相比,基本上模型应该预测D1的概率得分更高。 如何吸收S1是D1的强预测因子的信息,以便将其用于模型训练

试图对那些强有力的疾病组合预测因子进行过采样。但是不要认为这是正确的,因为我有一个多标签数据集。结果也没有反映

0 个答案:

没有答案