我正在学习如何将Rapidminer用于项目。我陷入了某种程度。我有一个数据集如下:有国家。对于每个国家,我要追踪1990 - 2012年的一些价值(奖牌可以说)。举个例子:
国家年金银铜奖
USA 1990 10 5 7
.....
USA 2012 12 3 8
Spain 1990 8 12 9
...
Spain 1992 7 ? 8
....
Spain 2012 4 11 12
...GOES ON...
我想要做的是替换缺失的值。例如,西班牙在1992年因银牌而失踪。我想找到西班牙可用的银数据的平均值,并用它替换缺失值。我怎样才能做到这一点?如果Rapidminer中的当前模块无法做到这一点,是否存在某种宏等?我也可以用Excel来预处理数据(但是如何)???。
答案 0 :(得分:1)
使用Replace Missing Values
运算符。它的默认设置用该列的平均值填充任何缺失的数据 - 正是您想要的。