对加权特征向量进行分类

时间:2012-07-15 13:56:25

标签: data-mining classification weighting

我想在任何分类算法(如KNN或J48)中使用该功能之前对数据集的功能赋予权重,但我不知道如何评估加权特征向量。
剂量任何分类算法都接受权重而不仅仅是'0'和'1'? 特别是,Weka的任何一个现成的分类函数能够使用权重(不是0和1作为过滤器)吗?

2 个答案:

答案 0 :(得分:0)

在大多数情况下,您可以根据权重缩放数据集。这对于证实Minkowski距离如欧几里得距离是微不足道的。

答案 1 :(得分:0)

并非所有weka的分类算法都支持权重,但有些算法支持权重。

您需要在加载数据集后设置权重信息,请参阅example code in weka wiki。我记得Weka J48,决策树,在开发者版本中支持权重但无法找到参考。但是存在patch

在weka wiki中搜索feature weights可能有所帮助。

我建议您尝试为数据中的数据集和培训添加权重。