特征提取和更高的灵敏度

时间:2018-03-22 15:02:49

标签: python machine-learning logistic-regression feature-extraction

在WBCD数据集上进行特征提取(PCA和LDA),然后进行逻辑回归时,我的灵敏度得到了提高,但精度却有所不同。我一直试图找到可以解释/已经研究过特征提取如何提高分类器灵敏度的文献,但我找不到任何东西。

1 个答案:

答案 0 :(得分:0)

特征提取减少了数据的维度。这通常用于创建较小的系统(以减少计算开销)和/或减少噪声(以获得更清晰的信号)。

关于无监督学习的统计学习导论(可用here)中给出了简明的介绍(p.373),我认为你在寻找什么。

以PCA为例。来自统计学习简介

  

当面对大量相关变量时,主体   组件允许我们用较少的数量汇总这个集合   代表性变量,共同解释大部分   原始集合的可变性。主要组成部分   在第6.3.1节中显示为特征空间中的方向   其中原始数据变化很大。这些方向也   定义尽可能接近数据的行和子空间   云。要执行主成分回归,我们只需使用   主成分作为回归模型中的预测因子代替   原来较大的变量集。

     

主成分分析(PCA)指的是过程   计算主成分,并随后使用这些成分   理解数据的组件。 PCA是一种无监督的方法,   因为它只涉及一组特征X1,X2,...,Xp和no   相关响应Y.除了生成派生变量以供使用   在监督学习问题中,PCA也可以作为数据工具   可视化(可视化观察或可视化)   变量)。我们现在更详细地讨论PCA,重点关注   使用PCA作为无监督数据探索的工具   本章的主题。

我的首选资源是统计学习要素(可免费获取here)。第534页以后对PCA进行了详细的讨论,将其应用于手写以使问题更容易处理。