当新数据具有不同的变量时,基于主成分的预测模型

时间:2019-10-17 12:05:45

标签: regression pca svd predictive

我建立了一个逻辑回归模型来对文档语料库进行分类。 因变量是文档的类型(例如A或B),而因维而因变量是通过对文档执行主成分分析(PCA)(或单值分解(SVD))获得的前两个成分。文档/术语矩阵的列(术语)。

问题是:在新的文档语料库上(因此在不同的文档/术语矩阵上),如果前两个成分是从一组不同的变量(术语)中获得的,那么使用相同模型在方法上是否正确?

0 个答案:

没有答案