Weka Explorer中的离群值处理

时间:2016-09-06 09:13:30

标签: weka

一旦在Weka中识别出异常值,而不是删除它们,我该如何处理这些值。例如,数据集具有列credit_balance,其值从1到1000开始,并且在应用四分位数范围的公式之后,我们得到值超过800的异常值记录。所以现在不是要删除这些记录,而是要将值800替换为均值为300。 我们怎么能在Weka Explorer中做到这一点?

由于

1 个答案:

答案 0 :(得分:1)

原油方法:使用以下导航进行探索。 流程>预处理>过滤器>选择>过滤器>无监督的>属性> AddExpression - 此选项将创建新字段,例如:ifelse(a2> 1000,200,1) 这里a2 - 是你的属性编号。

限制:这仅适用于特定属性。