我想使用一些机器学习分类方法(SVM,决策树或任何其他方法)对小数据集65x9进行分类。 因此,在开始分类之前,我想在Matlab或Weka(首选MatLab)中使用PCA进行属性分析。我想获得哪个属性对分类器的性能贡献最大。所以我可以减少一些属性的数量或/并在将来包含更多。任何PCA的例子都可以在MatLab或Weka中找到这个?
由于
答案 0 :(得分:1)
PCA是一种无监督的特征提取方法。
如果您的问题是选择要与PCA一起使用的属性,我不知道您的目的是什么,但没有必要这样做以提高分类性能。只需使用整个属性。 PCA将按每个实例的降序为您提供最佳属性。
如果您的问题是在PCA之后选择属性,您可以选择一个阈值(例如0.95)并计算#attributes足够的阈值从第一个属性开始到最后一个属性。您可以使用协方差矩阵的特征值来计算和实现PCA中的阈值。
运行PCA之后,我们知道第一个属性是最好的属性,第二个属性是第一个属性之后的最佳属性...