我有兴趣预测Y
并正在研究不同的两种衡量技巧X1
和X2
。例如,我想通过测量香蕉躺在桌子上的时间,或者通过测量香蕉上的褐色斑点的数量来预测香蕉的味道。
我想知道哪种测量技术更好,我应该选择只执行一种。
我可以在R中创建一个线性模型:
m1 = lm(Y ~ X1)
m2 = lm(Y ~ X2)
现在让我们说X1
是香蕉味道的优越预测因子而不是X2
。在计算两个模型的R ^ 2时,模型m1
的R ^ 2明显高于模型m2
。在撰写关于方法X1
如何优于X2
的论文之前,我想要某种迹象表明差异不是偶然的,可能是以p值的形式。
怎么会这样呢?当我使用不同品牌的香蕉并转向以香蕉品牌为随机效应的线性混合效应模型时该怎么做?
答案 0 :(得分:1)
对不起,如果不理解你的话。据我所知,这是简单的基本统计问题,而不是R。
你把它们放在一起回归。每个系数的p值显示它们是否重要。您也可以将香蕉品牌作为假人(如果没有太多类型)。并进行ANOVA测试。 顺便说一下,两种测量技术在单独的模型中是否重要?那些模型和组合模型的R ^ 2是什么? 至于你的问题,看看R ^ 2的定义,希望这会有所帮助:)