标签: regression pca svd predictive
我建立了一个逻辑回归模型来对文档语料库进行分类。 因变量是文档的类型(例如A或B),而因维而因变量是通过对文档执行主成分分析(PCA)(或单值分解(SVD))获得的前两个成分。文档/术语矩阵的列(术语)。
问题是:在新的文档语料库上(因此在不同的文档/术语矩阵上),如果前两个成分是从一组不同的变量(术语)中获得的,那么使用相同模型在方法上是否正确?