基于诊断的药物学习算法

时间:2017-01-03 09:31:04

标签: machine-learning classification prediction

训练数据集:

--------------------   
Patient Age:        25
Patient Weight:     60
Diagnosis one:      Fever
Diagnosis two:      Headache

    > Medicine:           **Crocin**

---------------------------------
Patient Age:        25
Patient Weight:     60
Diagnosis one:      Fever
Diagnosis two:      no headache

    > Medicine:           Paracetamol

----------------------------------

为患者提供药物/药物的样本数据集。

如何根据患者信息(年龄/体重)和诊断(发烧/ headeache /等)找到什么药?

1 个答案:

答案 0 :(得分:1)

您的目标任务是分类,因为目标值是名义尺度。

获得正确的词汇是至关重要的,因为所有其他工作已经由其他人完成,例如在sklearn Python库中,其中包含最相关的算法和大量数据来测试它们并学习算法。

您似乎有四个变量作为输入:

  1. 年龄 - 指标变量
  2. 重量 - 指标变量
  3. 诊断一 - 名义变量
  4. 诊断二 - 名义变量
  5. 您必须对名义变量进行编码,我会建议所有可能诊断的数组,例如:

    发烧,头痛,胃痛,x - [0,0,0,0]

    现在,如果诊断正确,则每个数组元素将设置为1,否则为0。 因此,您总共有2 + n个输入变量,而n是可能的症状数。

    然后你可以直接进入sklearn库并开始使用最简单的分类算法:Nearest Neighbour Classification

    如果这不会产生好结果(可能结果不好),您可以开始使用更复杂的模型(SVM,RandomForest)。然而,首先你应该学习词汇并使用简单的模型来了解方法和处理链。