如何使SalePrice为离散值?

时间:2019-07-30 00:32:20

标签: python machine-learning discrete-mathematics binning continuous

目标变量Saleprice最初是一个continuous值。我根据除Saleprice以外的其他变量计算了feature importance,并获得了功能的排名。

我的老师说我不允许将目标变量Saleprice用作其他变量。由于自变量用于预测作为目标变量的SalePrice。目标变量可以视为因变量,因为它取决于自变量。

她建议使用“我可以探索Saleprice”,因为它是binning method的连续变量,例如将Saleprice从100k装到150k。该范围可以视为单个值。 (视为离散值)

May I know how should I apply the binning method on Saleprice to make it as a discrete variable?

how does that being a discrete variable can help me better in building of model and prediction of Saleprice?

Dataset我仅使用火车数据。

1 个答案:

答案 0 :(得分:0)

装箱有助于减少数据中的噪声和非线性。模型很难找到与年龄(5,10,15,20)比较的年龄数据说(5,7,11,3,19,2,17)的关系)

Binning可轻松识别异常值,数字变量的无效值和缺失值。

有关合并实现的更多深度和类型,请尝试以下链接:https://www.geeksforgeeks.org/ml-binning-or-discretization/