我有一个过去几年中一个城市的房地产销售数据集。我正在尝试创建一个价格指数,但是却在代码中寻找任何示例,甚至在其他领域中使用的那些算法也很困难。据我了解,主要使用的算法是RSR,Case-Shiller和享乐回归。也许还有其他方法?但同样,我无法在线上找到任何可用的东西,到目前为止,我看过的所有ML工作都旨在估计各个属性的值。如果有人可以提出建议,将不胜感激。
此外,我还应该考虑哪些其他因素以及应该考虑哪些方法?
答案 0 :(得分:0)
关于这个非常有趣的问题的几点思考:
我真的不明白您将如何或为什么使用机器学习。您不是要预测或寻找模式,而是要将具有高复杂度的数据集简化为一个随时间保持可比性的数字。
如前所述,您要研究的现实的复杂性非常高,必须考虑很多很多事情。
例如,长期指数可能会面临以下问题:在几十年中,平均房屋面积可能会发生很大变化。这可能会导致价格上涨或下跌,但这将由房屋属性的变化而不是市场给出的估值引起。价格会上涨,因为房屋会更好,而您的指数应该说明这一点。
最后,我建议您阅读一些内容。具有价格指数的机构通常会发布其方法论,您可以从中学到很多东西。我建议使用Eurostat的this。 This由西班牙国家统计局(National Institute of Statistics)撰写,虽然很好,但很简洁,但是是西班牙文。
顺便说一句,您可能可以在CrossValidated中找到对该问题的更好答案。