我想使用WEKA来学习我正在使用的功能的权重,以便创建文档集群。我从每个文档中提取了一些特征,但每个特征在聚类方法中具有不同的重要性。 我有一个用于训练的数据集,其中每个文档由每个特征与另一个文档的距离相似性“表示”,如果它们属于同一个集群或0,则为第一类。 我如何使用WEKA来通过交叉验证来学习权重? 谢谢, EVI
答案 0 :(得分:0)
首先,无法以ARFF文件格式添加权重。而必须使用 XRFF 文件格式。可以为每个单独的实例或属性添加更多权重。
查看以下链接以获取示例。
http://weka.wikispaces.com/XRFF#Additional%20features-Attribute%20weights
http://weka.wikispaces.com/Add+weights+to+dataset
http://weka.8497.n7.nabble.com/can-I-weight-an-attribute-in-the-arff-file-td22889.html