我已经阅读了关于Extensions of Biplot Methodology to Discriminant Analysis的Gardner和Le Roux的论文。我想问一下是否有人对该方法有任何实际经验。 我有一个来自kaggle人力资源分析数据集的FDA模型,可在此处data set获取。我用了代码
smp.size = floor(0.7*nrow(data))
set.seed(123)
train.ind = sample(seq_len(nrow(data)), size = smp.size)
train = data[train.ind,]
test = data[-train.ind,]
以适应模型。使用
选择训练样本biplot
当我尝试使用biplot(modFDA$finalModel)
函数时,我会因错过y值而出错。我知道有一个ggbiplot函数,但它似乎只适用于LDA,因为它需要线性判别式来绘图。而且我在模型输出中找不到那些更准确的判别值。我似乎错过了一些东西,但我无法弄清楚它是什么......
我的一些代码
train_z = lapply(train, function(x) if (is.numeric(x)) scale(x) else x)
FDAfit = fda(left~., data = train_z)
df = fortify(FDAfit, train_z)
返回缺少的y值。
还尝试缩放数据集
aes
尝试使用虹膜数据上的示例来拟合ggplot,但是使用LDA,但不知道对g <- ggplot(df, aes(x = (LD1)?, y = (LD2)?)) +
geom_point(aes(color = left)) +
stat_ellipse(aes(group = left, color = left)) +
geom_axis(data = attr(df, "basis"), aes(label = abbreviate(.name))) +
coord_equal()
使用什么。似乎没有名为geom_axis的函数
ThisWorkbook