我有.arff文件:
@RELATION Employee
@ATTRIBUTE EmployeeID string
@ATTRIBUTE sex {male,female}
@ATTRIBUTE age {young,middle-age,old-age}
@DATA
’5s6s6ss’,male,old-age
’5s6s6tt’,female,old-age
’5s6s6ii’,male,young
我想在WEKA中创建集群,但我有字符串属性" EmployeeID"。我必须忽略string属性,但是如何显示哪个EmployeeID在集群0和集群1中?
答案 0 :(得分:0)
在" Preprocess" panel使用无监督属性Filter AddCluster
将Cluster Assigmment添加到Result。不要忘记在过滤器的配置对话框中设置ignoreAttributeIndices
值。在这里你应该输入" 1"为了从集群过程中排除EmployeeID(因为它具有太多的预测/判别力)。属性值仍将显示在表格中。