关于Weka CfssubsetEval特征选择归一化要求的问题

时间:2019-07-05 08:32:59

标签: weka

我是数据科学专业的学生,​​关于特征选择算法的问题很简短

CfsSubsetEval

(Hall,M。A.(1998年)。基于相关性的机器学习特征子集选择,博士学位论文,757 怀卡托大学,新西兰汉密尔顿)

在Weka数据挖掘程序包中找到

我的问题是: 我应该在使用CfsSubsetEval选择特征之前对数据(分子描述符)进行归一化吗?

据我了解,在将此特征选择算法应用于数据集之前,该数据集不会 需要归一化(例如,除以标准偏差,再除以均值)。

这种观察是通过霍尔论文中的陈述得出的: “ CFS在原始特征空间上运行,.....可以解释为 就其原始特征而言,而不是对转换后的空间而言。”

由于特征空间是离散的,我将其理解为归一化,因为将不同的特征分割为相等数量的bin范围。

但是我想绝对确定这个问题。希望这里的任何人都能启发我,最好是引用一个可以引用的参考文献。

真诚的

0 个答案:

没有答案