如何查看R中插入符号列车模型中的奇点

时间:2013-12-10 14:11:14

标签: r cross-validation r-caret

我有一个161 x 151的数据库,我在我的数据集上应用了以下内容: -

> ctrl <- trainControl(method = "repeatedcv", number = 10, repeats = 10, savePred = T)
> model <- train(RT..seconds.~., data = cadets, method = "lm", trControl = ctrl)

我得到了回报

Coefficients: (82 not defined because of singularities)

我知道这意味着我的很多变量都是共线的,因此不是自变量。所以我希望能够查看我的数据的系数矩阵,所以我做了: -

 cor(cadets, use="complete.obs", method ="kendall")

但是您可以想象的结果是大到适合我的R屏幕。有没有办法查看模型矩阵,以便我可以看到哪些变量是彼此共线的,此外,如果我的变量是共线的,我可以从这里开始做什么以更好地改进模型?我怎么过来的?

由于

1 个答案:

答案 0 :(得分:0)

它在插入符号手册的预处理部分中描述(大约一半的页面): http://caret.r-forge.r-project.org/preprocess.html

所以对于你的学员数据,它就像(未经测试):

cadetsCor <- cor(cadets)
highlyCorCadets <- findCorrelation(cadetsCor, cutoff = 0.75)
cadets <- cadets[, -highlyCorCadets]

另一种选择是尺寸减小......例如PCA但是你的模型可能会获得预测能力但却失去了解释性。