目标变量Saleprice
最初是一个continuous
值。我根据除Saleprice以外的其他变量计算了feature importance
,并获得了功能的排名。
我的老师说我不允许将目标变量Saleprice用作其他变量。由于自变量用于预测作为目标变量的SalePrice。目标变量可以视为因变量,因为它取决于自变量。
她建议使用“我可以探索Saleprice”,因为它是binning method
的连续变量,例如将Saleprice从100k装到150k。该范围可以视为单个值。 (视为离散值)
May I know how should I apply the binning method on Saleprice to make it as a discrete variable?
和
how does that being a discrete variable can help me better in building of model and prediction of Saleprice?
Dataset我仅使用火车数据。
答案 0 :(得分:0)
装箱有助于减少数据中的噪声和非线性。模型很难找到与年龄(5,10,15,20)比较的年龄数据说(5,7,11,3,19,2,17)的关系)。
Binning可轻松识别异常值,数字变量的无效值和缺失值。
有关合并实现的更多深度和类型,请尝试以下链接:https://www.geeksforgeeks.org/ml-binning-or-discretization/