我通过在R
中使用FSelector包在R中完成了信息增益功能选择install.packages("RWekajars")
install.packages("FSelector")
library(FSelector)
weights <- information.gain(Classname~., df)
Attributes attr_importance
X.1 3.6349780
X 3.6349780
Value_1 3.7128973
Value_1 0.9652070
Item_1 2.0845525
现在,我需要根据 attr_importance 选择最佳功能。如何根据阈值选择R中的最佳特征以及如何设置阈值?
答案 0 :(得分:0)
包 FSelector 中的方法clist
可以解决您的问题:
例如:c1 c2 a1 c3 c4 a2 c5 c6 a3 c7 c8 a4...
将返回所有属性,直到达到0.9。
或者:cutoff.k
将返回具有最多信息增益的2个属性。
这可以解决你的问题吗?