我有一个包含房屋的几个特征的数据集,包括类型,位置,卧室数量等。例如:
我想预测的目标变量是房价。但是,原始数据集中给出的房价是价格的间隔而不是数值,例如:
所以我的问题是,如果我想预测房价的范围,我应该使用什么样的模型?简单的回归模型似乎不起作用,因为我们预测的是间隔而不是连续的数值。
提前致谢。
答案 0 :(得分:1)
我会使用价格范围的中位数并运行线性回归。在您的情况下,标签将是{50000,125000,175000,225000,...}。在得到预测价格后,只需选择它所涉及的范围。
或者,如果价格范围是固定的,您可以使用一对一逻辑回归,但我确信这不是最好的方法。