WEKA IBK(KNN)算法如何引导非标准化属性?

时间:2013-05-22 19:36:01

标签: normalization weka knn

我有两个具有不同属性比例的类的大型数据集(例如,一些属性从5到10,其他属性从0到100)。我知道如果我直接使用kNN算法,差异将使分析无效,我需要规范化属性。

WEKA上的一些分类器似乎做了规范化,比如RBF或SMO,但我需要使用其他分类器,首先是IBK分类器(KNN)。

weka是否以某种方式引领它?如何在KNN分类中加入归一化过程?

由于

2 个答案:

答案 0 :(得分:0)

为了获得最大的自由度(以最适合您的方式转换属性的能力:标准化,最小 - 最大标准化等),您可以使用例如MATLAB(或Python ...)来标准化您的属性。 为此,您必须以矩阵的形式加载/存储数据集(其中列对应于您的属性,而行对应于训练实例/示例,通常用于CSV文件)。然后,您可以轻松地使用列进行操作,例如循环遍历每一列并对其进行规范化。

最后,您可以将具有规范化特征的新数据集提供给Weka。

答案 1 :(得分:0)

在“预处理”面板中,有一个名为“Normalize”的无监督属性过滤器。