我们如何使用机器学习计算数据集中功能的重要性?哪种算法更好,为什么?
答案 0 :(得分:0)
有几种方法使模型适合数据,并根据拟合将特征从最相关的特征分类到不太相关的特征。如果您想了解更多仅谷歌功能选择。
我不知道您正在使用哪种语言,但这里是指向它的python页面的链接: http://scikit-learn.org/stable/modules/feature_selection.html
您可以使用此功能:
这将根据分类器的拟合消除数据集中不太有意义的特征,您可以选择逻辑回归或SVM,并选择剩余的要素数。
我认为最佳方法的选择取决于数据,因此需要更多信息。