Question

我一直在尝试使用mdatools包使用plsda（）函数运行pls-da。我有9000个变量的数据和大约30个观测值。 30行中的每一行都是患者;第一列包含每位患者（疾病或对照）的临床状态，其余8999列包含患者的数字数据。我使用以下代码运行plsda：

plsda(data[,2:9000], data[,1], ncomp = 8999, coeffs.ci = 'jk')

当代码最终编译时，它返回一个错误，说＆＃34; selectCompNum.pls（model，ncomp）中的错误：所选组件的数量错误！＆＃34;

我选择ncomp = 8999作为2到9000的数字总数......奇怪的是，这适用于少量组件。例如，当我尝试

时

plsda(data[,2:10], data[,1], ncomp = 9, coeffs.ci = 'jk')

未返回任何错误消息。

也许我误解了如何选择合适数量的组件？我非常感谢任何帮助。非常感谢你提前！

Answer 1

我是mdatools软件包的开发者，并且偶然遇到了您的问题。 PLS / PLS-DA中的组件数是许多潜在变量。每个潜在变量都是原始变量的线性组合。通常，您需要比原始变量少得多的组件，具体取决于组件的数据类型数量可以从1-2到10-20。我建议您查看tutorial的PLS部分并直接询问我（例如通过电子邮件），如果您对该软件包仍有任何疑问或问题。

R

1 个答案: