稀疏和不平衡高维数据的特征选择

时间:2014-07-22 18:07:04

标签: sparse-matrix correlation pearson

我的数据非常不平衡,标签非常稀少。数据的维度非常高。最重要的是,我的功能也很稀疏。

那么在这种情况下进行特征选择的最佳方法是什么。基于像spearmann或pearson相关性的任何相关性度量等级将不是一个好的。因为我的大多数标签和功能都是零,并且看起来这个功能高度相关或者某些东西即使它没那么重要。

有什么建议吗?

1 个答案:

答案 0 :(得分:0)

SVM适用于稀疏数据的分类。通过检查生成的内核矩阵,您可以识别比其他特征更重要的特征,并将其用于特征选择。