训练数据集:
--------------------
Patient Age: 25
Patient Weight: 60
Diagnosis one: Fever
Diagnosis two: Headache
> Medicine: **Crocin**
---------------------------------
Patient Age: 25
Patient Weight: 60
Diagnosis one: Fever
Diagnosis two: no headache
> Medicine: Paracetamol
----------------------------------
为患者提供药物/药物的样本数据集。
如何根据患者信息(年龄/体重)和诊断(发烧/ headeache /等)找到什么药?
答案 0 :(得分:1)
您的目标任务是分类,因为目标值是名义尺度。
获得正确的词汇是至关重要的,因为所有其他工作已经由其他人完成,例如在sklearn Python库中,其中包含最相关的算法和大量数据来测试它们并学习算法。
您似乎有四个变量作为输入:
您必须对名义变量进行编码,我会建议所有可能诊断的数组,例如:
发烧,头痛,胃痛,x - [0,0,0,0]
现在,如果诊断正确,则每个数组元素将设置为1,否则为0。 因此,您总共有2 + n个输入变量,而n是可能的症状数。
然后你可以直接进入sklearn库并开始使用最简单的分类算法:Nearest Neighbour Classification
如果这不会产生好结果(可能结果不好),您可以开始使用更复杂的模型(SVM,RandomForest)。然而,首先你应该学习词汇并使用简单的模型来了解方法和处理链。