我正在使用包含大量缺失值的数据集。出于分析目的,我希望能够以下列方式计算分配给每个类标签的平均非缺失属性数。
拥有类似
的数据@relation class
@attribute one {1,2}
@attribute two {1,2}
@attribute three {1,2}
@attribute class {human, animal}
@data
1,Na,Na,human
1,1,Na,human
Na,Na,2,animal
我希望能够获得这样的结果。
Average non-missing attributes per class label:
- human = 1.5
- animal = 1
在WEKA资源管理器中有没有办法做到这一点?