在WBCD数据集上进行特征提取(PCA和LDA),然后进行逻辑回归时,我的灵敏度得到了提高,但精度却有所不同。我一直试图找到可以解释/已经研究过特征提取如何提高分类器灵敏度的文献,但我找不到任何东西。
答案 0 :(得分:0)
特征提取减少了数据的维度。这通常用于创建较小的系统(以减少计算开销)和/或减少噪声(以获得更清晰的信号)。
关于无监督学习的统计学习导论(可用here)中给出了简明的介绍(p.373),我认为你在寻找什么。
以PCA为例。来自统计学习简介:
当面对大量相关变量时,主体 组件允许我们用较少的数量汇总这个集合 代表性变量,共同解释大部分 原始集合的可变性。主要组成部分 在第6.3.1节中显示为特征空间中的方向 其中原始数据变化很大。这些方向也 定义尽可能接近数据的行和子空间 云。要执行主成分回归,我们只需使用 主成分作为回归模型中的预测因子代替 原来较大的变量集。
主成分分析(PCA)指的是过程 计算主成分,并随后使用这些成分 理解数据的组件。 PCA是一种无监督的方法, 因为它只涉及一组特征X1,X2,...,Xp和no 相关响应Y.除了生成派生变量以供使用 在监督学习问题中,PCA也可以作为数据工具 可视化(可视化观察或可视化) 变量)。我们现在更详细地讨论PCA,重点关注 使用PCA作为无监督数据探索的工具 本章的主题。
我的首选资源是统计学习要素(可免费获取here)。第534页以后对PCA进行了详细的讨论,将其应用于手写以使问题更容易处理。