在我的数据集中,有3个名义属性,我想将它们转换为k-mean clustering algorithm
的数字。在Weka中,我发现的唯一过滤器是NominalToBinary
,当我使用它时,会创建与那里名义值的数量相对应的新属性。这是正常的吗?为什么没有NominalToNumeric
是Weka?
谢谢。
答案 0 :(得分:1)
考虑一下nominal attribute是什么。这意味着您的属性值中没有排序。你能说男>女。因此,您应该使用NominalToBinary过滤器将名义属性更改为二进制属性。
如果你的属性不是名义上的,而是序数;那么,你需要使用自定义转换。这种自定义转换很难实现,并且对于每个数据集都是不同的。
我建议使用RenameNominalValues将您的序数属性赋予数值,然后使用文本编辑器将属性类型从名义更改为数字。
例如,使用RenameNominalValues将Hot,Mild,Cool,Cold更改为40,20,10,0,然后使用文本编辑器。 但正如你所看到的,我的价值观完全是武断的,可能不是一个很好的选择。