标签: sparse-matrix correlation pearson
我的数据非常不平衡,标签非常稀少。数据的维度非常高。最重要的是,我的功能也很稀疏。
那么在这种情况下进行特征选择的最佳方法是什么。基于像spearmann或pearson相关性的任何相关性度量等级将不是一个好的。因为我的大多数标签和功能都是零,并且看起来这个功能高度相关或者某些东西即使它没那么重要。
有什么建议吗?
答案 0 :(得分:0)
SVM适用于稀疏数据的分类。通过检查生成的内核矩阵,您可以识别比其他特征更重要的特征,并将其用于特征选择。