回归的分类特征选择

时间:2021-07-20 12:17:44

标签: python feature-selection

对于编码评估,我有一个回归问题。我之前也做过这个,问题很像波士顿房价问题,所以我不太担心问题本身。

我的主要问题是决定要包含哪些功能。在 52 个特征中,只有 6 个是数字特征(其中 4 个实际上可用),其他是分类特征。这些分类特征有 2 到 120 个类别,因此并非所有类别都可以轻松进行单热编码。

我正在努力寻找一种方法来过滤这些特征/做出选择以包含在模型中,因为我确信并非所有特征都带有有用的信息。

解决这个问题的逻辑方法是什么?除了“一种热编码和绘制结果”之外,我很难在网上找到一些好的来源。

0 个答案:

没有答案