我试图更好地理解R公式在数学上意味着什么。
例如:lm(y ~ x)
符合y = Ax + B
lm(y ~ x + z)
是否适合飞机y = Ax + Bz + C
?
lm(y ~ x + z + x:z)
是否适合飞机y = Ax + Bz + Cxz + D
?
答案 0 :(得分:0)
您的理解是正确的!虽然更抽象地理解它可能会有所帮助。你的线性模型(lm)只意味着它是一维依赖性的拟合参数(Ax不是Ax ^ 2或Asin(x)或任何比它更漂亮的东西)。
但这并不意味着它只适合1到3个参数。想象一下,食物代表的维度:谷物,水果,蔬菜,肉类和乳制品构成我们的5“食物维度”。这些东西显然是相互关联的 - 甚至可能不是独立的 - 但仍然不能以完全相同的方式完全描述。我们可以把我们的模型看作衡量我们系数的工具 - 在这个食物例子中我们可以想象为“味道”,如甜,辣,酸等。
然后我们的模型采用不同维度的点(食物组),并试图通过它们的系数值(风味)将它们联系起来。然后,该模型允许我们描述其他食物/风味。这实际上是大多数模型“做”的事情:他们在注释数据上“训练”自己并建立关系 - 线性模型只是将味道与食物组的数量成正比。
我希望这个解释很有帮助。如果有任何不清楚的地方,请告诉我。此外,我会将此作为评论,但尚未累积所需的50分。遗憾!