我正在使用Weka应用程序并使用CVS文件,我需要删除缺少值的实例。我试图使用多重过滤器并使用removevalues过滤器,但我认为我做错了,因为它过滤了我的所有实例。我该如何正确地做到这一点?
答案 0 :(得分:1)
要从少数属性中删除缺少值的实例,可以使用select cast(dateadd(month,-1,dateadd(day,24 - datepart(day,getdate()),getdate())) as date) [24th of previous month],
cast(dateadd(day,23 - datepart(day,getdate()),getdate()) as date) [23rd of current month]
并使用表达式,例如
weka.filters.unsupervised.instance.SubsetByExpression
删除索引为5的属性中缺少值的实例,或
not ismissing(ATT5)
删除属性5或8中缺少值的实例,依此类推。
如果您尝试使用not (ismissing(ATT5) or ismissing(ATT8))
过滤器,可以通过这种方式完成,但需要清除RemoveWithValues
字段(从过滤器命令中删除nominalIndices
参数)和将-L
值设置为比正在过滤的属性的最小值更负。否则,此过滤器将匹配其值与任何这些条件匹配的任何实例。
我无法看到删除任何属性中缺少值的实例的任何明显方法,除了构建splitPoint
的表达式,逐个检查所有这些