我有7个不同的分段线性回归模型,我想使用成对比较测试来比较不同断点的模型。
基本上我想将我的所有模型合并为1个模型,其中7个因素将不同的模型分开并进行比较,但到目前为止,我还没有找到任何可以回答的内容,如果这是可能的话。
感谢您的帮助!
答案 0 :(得分:0)
(你应该更具体地说明你的问题:发布一个例子或至少伪代码。)但似乎,在简化版中,你有
(1)对具有分类变量的数据进行线性回归(具有七个类别:因此,类似于6或7个虚拟变量)也表示连续变量的值范围(因此'分段&# 39)。例如,年龄1-10,10-30,30-50,..分为1,2,3,...,
(2)手动将数据拆分为七个(因为你有理由相信),并适合单独的回归。
(2)中的成对模型比较可以像比较每个模型的拟合一样简单。 (1)有点可行:例如,对于所有七个类别,您的拟合回归模型是:
http://i.stack.imgur.com/szN0C.gif
将类别1设置为基线。由于我们需要成对比较,只需采用类别1和2,再次使用1作为基线,并进行F测试,比较此模型和(嵌套的或更小的)拟合模型:
http://i.stack.imgur.com/dDWjo.gif
这使您可以查看是否包含有关第二类的信息是否有意义。所有成对比较可以以类似的方式进行,或者通过连续地将特定模型与添加有附加类别的模型进行比较来进行。此外,如果要同时比较所有这7个,则应将p值与0.05 / 7进行比较。在这里,我们描述了模型差异仅在截距中的情况,但是在两个模型中的比较中,对于“协变量”,它们的斜率也不同。 (以上示例中的x_1)对于不同的类别也可以以类似的方式进行测试。
(你的第一段表明你的目标可能是找到最好的截止点。一种方法是彻底“采取所有截止组合”(在离散的方式,因为否则它是不可数的许多组合),使每个模型适合训练数据,并且只需找到最适合你的测试数据的那个。)