我在excel中有两个数据集,我想加入但有一个重大转折。以下是我的数据:
请注意以下几点: 1-对于ID 3,sheet1中的电话与sheet2中的电话不同; 对于ID 4,在Sheet2中有电话号码,但在sheet1中没有电话号码
我想要的是包含所有信息的这两张纸的组合。因此,缺少的值将被填充,只要有相同ID的2个不同值,我希望rapidminer创建一个包含其他值的附加列(例如:phonenumber1,phonenumber2)。
注意我不是一个非常技术性的人,因此如果有一个简单的解决方案,请告诉我,如果它很复杂,请详细解释我需要做的步骤。
THX!
答案 0 :(得分:1)
如果正确设置参数,Join
运算符将执行您想要的操作。首先,在阅读完电子表格后,将两个示例集连接到Join
运算符。将此运算符的key attributes
设置为ID
,将age
设置为左右键。接下来,清除remove double attributes
参数。
运行该过程后,您应该看到其他列。