我正在尝试深入研究R,我目前正在使用LDA(线性判别分析)。我正在使用经典的虹膜数据集。我可能误解了一些东西,但我的问题是:当我创建一个训练集(使用所有样本)时,我得到以下内容,这意味着一些杂色样本被定性为virginica,反之亦然:
setosa versicolor virginica
setosa 50 0 0
versicolor 0 48 2
virginica 0 1 49
但在我的情况下,我想将虹膜训练集用作手动策划值,以便让我对新的未知虹膜样本进行分类。那么,如果我想强制LDA接受样品列正确分类的每个样品,我该怎么办?
提前致谢
PS:我使用的简单代码:
require(MASS)
train50 <- sample(1:150, 150)
ldatrain50 <- lda(Species ~ .,
data=iris,
prior = c(1,1,1)/3,
subset = train50)
p50 <- predict(ldatrain50) ##get info on the model
tab <- table(iris$Species[train50],p50$class)
print(tab)