加入Rapidminer

时间:2016-08-18 11:08:45

标签: join rapidminer

我在excel中有两个数据集,我想加入但有一个重大转折。以下是我的数据:

enter image description here

请注意以下几点: 1-对于ID 3,sheet1中的电话与sheet2中的电话不同; 对于ID 4,在Sheet2中有电话号码,但在sheet1中没有电话号码

我想要的是包含所有信息的这两张纸的组合。因此,缺少的值将被填充,只要有相同ID的2个不同值,我希望rapidminer创建一个包含其他值的附加列(例如:phonenumber1,phonenumber2)。

注意我不是一个非常技术性的人,因此如果有一个简单的解决方案,请告诉我,如果它很复杂,请详细解释我需要做的步骤。

THX!

1 个答案:

答案 0 :(得分:1)

如果正确设置参数,Join运算符将执行您想要的操作。首先,在阅读完电子表格后,将两个示例集连接到Join运算符。将此运算符的key attributes设置为ID,将age设置为左右键。接下来,清除remove double attributes参数。

运行该过程后,您应该看到其他列。