数字过滤器和缺失值(Weka)

时间:2012-04-20 08:24:59

标签: filter numeric weka missing-data

我正在使用SMOTE对我的数据集进行过采样(受到类不平衡的影响)。我的一些属性具有整数值,其他属性只有两位小数,但SMOTE创建了具有许多小数的新实例。因此,为了解决这个问题,我想使用NumericCleaner Filter并设置我想要的小数位数。这似乎有效,但我遇到了缺少值的问题。每个缺失值都替换为0.0值,我需要使用数据集中的缺失值来评估我的模型。那么我如何使用NumericCleaner(或允许舍入值的其他过滤器)并保留我的缺失值?

1 个答案:

答案 0 :(得分:1)

非常有趣的问题。好的,这是解决方案:

  1. 使用SMOTE对少数群体进行过采样(这会产生小数点,但缺失值仍为缺失值)
  2. 然后选择weka filter-> unsupervised-> attribute-> NumericTransform
  3. 然后单击此过滤器并设置属性实例(您具有小数点的功能),并在methodName而不是“abs”中输入“ceil”。
  4. 我希望能解决问题。