具有三个变量的数学函数(相关)

时间:2016-10-04 21:28:22

标签: algorithm math

我想分析一些数据以编制定价算法。 以下日期可供选择:

enter image description here

我需要三个变量/维度的函数/相关因子,它们显示中位数(价格)的变化,而三个维度(pers_capacity,卧室数量,浴室数量)增长。 例如Y(#pers_capacity,卧室,浴室)= ..

请注意: - 在下面的屏幕截图中并非所有可用数据(只是其中的一部分) - 中位数=>每晚价格 - 黄色=> #bathroom

e.g。 2人,2间卧室和1间浴室的中位数价格为每晚187美元

您是否有一些想法如何计算相关性/方程式(f(..)= ...)以获得可靠的因子?

亲切的问候

1 个答案:

答案 0 :(得分:3)

一种典型的方法是将其制定为线性模型。给定三个变量 x y z ,它们解释了你的观察值 v ,你假设 v < / em>≈ ax + by + cz + d 并尝试查找 a b c d 尽可能匹配,最小化误差平方。这称为linear least squares approximation。您还可以参考this Math SE post获取特定线性最小二乘近似的一个示例。

如果您的数据集足够大,您可能会考虑更复杂的公式。像

这样的事情

v a 1 x 2 + a 2 y 2 + a 3 z 2 + a 4 xy + a 5 xz + a 6 yz + a 7 x + a 8 y + a 9 z + <子> 10

以上在变量中是非线性的,但在系数 a i 中仍然是线性的,因此它仍然是线性的最小二乘问题。 或者您可以将变换应用于变量,例如

v a 1 x + a 2 y + a 3 z + a 4 exp( x )+ a 5 exp( y )+ a 6 exp( z )+ <子> 7

查看其中任何一项的残差(即预测值与观测值之间的差异)可能表示值得添加的术语。

我个人在R中尝试所有这些,因为在该语言中计算线性模型只是one line,并且可视化数据也相当容易。