我正在进行分类,我有关于使用LDA进行降维的问题:
是否应将LDA应用于包括列车和测试数据在内的整个特征矩阵,然后(在减小数据维数后)对特征矩阵进行分区,以便为分类提供训练和测试集?这是真的吗?
然后,假设我们需要在应用LDA之前对数据进行分区。 如何使用Matlab的内部分类器(如kNN和SVM)对测试数据进行分类?
答案 0 :(得分:3)
您应该在火车上生成LDA,然后将其应用到测试集上。
原因是您不想检查整个处理链如何对看不见的数据执行操作。如果您在火车/测试中生成LDA模型,则可能是其他不太重要的信息可能会消失。
实际上,如果您确定了列车/测试/验证拆分的维度数量。在哪里确定列车/测试的最佳维数。然后在列车上构建LDA +模型并测试合并并在验证时进行评估。