我是该地区的新手,我正在尝试使用Rapidminer解决分类问题。我得到了一个访问医生的数据集,我必须检测再入院病例,因为它最初是在一个具有一对多关系的表格中,对于每种不同的药物,我有几行相对于同一次访问。
例如:
Consult_ID| Patient_ID | Medic_ID | MedicamentPrescribed |Readmission
133 | 9893 | 23 | Med_X |YES
133 | 9893 | 23 | Med_Y |YES
不幸的是,给出的格式不在我的手中,因此我必须使用它。我想知道是否有任何标准解决方案(可能包含在Rapidminer中)来解决这样的问题?
我能想到的唯一方法是创建一个带有访问的新表,添加每种可能的药物作为新功能,然后指出它是否是处方但我对它不满意,因为它会是荒谬的高具有NULL字段的特征数(518种不同的药物)。 我还可以在一个列(Med_X,Med_Y)中连接所有药物,但是我会在这个过程中丢失很多信息,因为它会认为这个新的字符串是它自己的药物。