如何通过使用R语言中的FSelector信息增益设置阈值来仅选择最佳功能?

时间:2017-01-04 16:27:47

标签: r information-gain fselector

我通过在R

中使用FSelector包在R中完成了信息增益功能选择
install.packages("RWekajars")
install.packages("FSelector")
library(FSelector)

weights <- information.gain(Classname~., df)

Attributes                                          attr_importance
X.1                                              3.6349780
X                                                3.6349780
Value_1                                          3.7128973
Value_1                                          0.9652070
Item_1                                           2.0845525

现在,我需要根据 attr_importance 选择最佳功能。如何根据阈值选择R中的最佳特征以及如何设置阈值?

1 个答案:

答案 0 :(得分:0)

FSelector 中的方法clist可以解决您的问题:

  • cutoff.k选择k个最佳属性
  • cutoff.k.percent选择最佳k * 100%的属性
  • cutoff.biggest.diff选择一个明显优于其他属性的属性子集。

例如:c1 c2 a1 c3 c4 a2 c5 c6 a3 c7 c8 a4...将返回所有属性,直到达到0.9。 或者:cutoff.k将返回具有最多信息增益的2个属性。 这可以解决你的问题吗?