我正在运行使用CAT分数进行特征选择的机器学习算法
library(sda)
train1<- data.matrix(train, rownames.force = NA)
ranking.LDA = sda.ranking(train1[,1:lengthvar], train1[,lengthtrain], diagonal=FALSE)
topfs<-which(ranking.LDA[,"score"] >2)
我的问题是如何要求CAT分数给我例如前20个功能?我可以提取特征的唯一方法是设置阈值,但是通过这种方法,可以为不同的数据集提供多种特征。我想要的总是有例如。前20个(或其他任何数字)功能。
预先感谢您的宝贵贡献。
答案 0 :(得分:1)
排名。LDA给出数字列表。因此,我们使用列表功能。
#As ranking.LDA gives a ranking of predictors we directly extract column names using this ranking.
colnames(train1[,ranking.LDA[1:20]])