我的数据集由大约300个对象组成,每个对象有84个特征。对象已经分为两类。使用PCA我可以将维数降低到大约24.我使用了3个主要组件,覆盖了原始数据的96%的方差。我遇到的问题是PCA并不关心将类彼此分开的能力。有没有办法将PCA用于减少特征空间和LDA,以便为这两个类找到判别函数? 或者有没有办法使用LDA以最佳方式找到在三维空间中分隔两个类的特征?
我有点恼火,因为我找到了这篇论文,但我并不是真正理解。 http://faculty.ist.psu.edu/jessieli/Publications/ecmlpkdd11_qgu.pdf提前致谢。
答案 0 :(得分:1)
您应该查看主要组件回归上的this article(PCR,如果要解释的变量是标量,您想要的是什么)和使用MATLAB的偏最小二乘回归(PLSR)统计工具箱。在本质上,在PCR中,您选择主要组件,因为它们最能解释因变量。它们可能不是方差最大的那些。