使用rapidminer处理一对多分类

时间:2014-05-30 09:51:15

标签: machine-learning classification data-mining rapidminer

我是该地区的新手,我正在尝试使用Rapidminer解决分类问题。我得到了一个访问医生的数据集,我必须检测再入院病例,因为它最初是在一个具有一对多关系的表格中,对于每种不同的药物,我有几行相对于同一次访问。
例如:

Consult_ID| Patient_ID | Medic_ID | MedicamentPrescribed |Readmission
133       | 9893       | 23       | Med_X                |YES
133       | 9893       | 23       | Med_Y                |YES

不幸的是,给出的格式不在我的手中,因此我必须使用它。我想知道是否有任何标准解决方案(可能包含在Rapidminer中)来解决这样的问题?

我能想到的唯一方法是创建一个带有访问的新表,添加每种可能的药物作为新功能,然后指出它是否是处方但我对它不满意,因为它会是荒谬的高具有NULL字段的特征数(518种不同的药物)。  我还可以在一个列(Med_X,Med_Y)中连接所有药物,但是我会在这个过程中丢失很多信息,因为它会认为这个新的字符串是它自己的药物。

0 个答案:

没有答案