R

时间:2017-07-17 20:10:09

标签: r

我一直在尝试使用mdatools包使用plsda()函数运行pls-da。我有9000个变量的数据和大约30个观测值。 30行中的每一行都是患者;第一列包含每位患者(疾病或对照)的临床状态,其余8999列包含患者的数字数据。我使用以下代码运行plsda:

plsda(data[,2:9000], data[,1], ncomp = 8999, coeffs.ci = 'jk')

当代码最终编译时,它返回一个错误,说" selectCompNum.pls(model,ncomp)中的错误:所选组件的数量错误!"

我选择ncomp = 8999作为2到9000的数字总数......奇怪的是,这适用于少量组件。例如,当我尝试

plsda(data[,2:10], data[,1], ncomp = 9, coeffs.ci = 'jk')

未返回任何错误消息。

也许我误解了如何选择合适数量的组件?我非常感谢任何帮助。非常感谢你提前!

1 个答案:

答案 0 :(得分:-1)

我是mdatools软件包的开发者,并且偶然遇到了您的问题。 PLS / PLS-DA中的组件数是许多潜在变量。每个潜在变量都是原始变量的线性组合。通常,您需要比原始变量少得多的组件,具体取决于组件的数据类型数量可以从1-2到10-20。我建议您查看tutorial的PLS部分并直接询问我(例如通过电子邮件),如果您对该软件包仍有任何疑问或问题。