我正在分析各种认知测验(以及那些测验的重复)之间的可重复性。我尝试使用R中的rptR包来确定鸟类的个体可重复性。但是,无论我的模型是什么,也不管我在测试什么,它总是会导致警告,并且R =0。我试图理解是什么原因引起的。
我目前有一个数据框,其中包括:一个ID(每个人重复两次)。每个ID重复都伴随有该测试的分数。首先对这些分数进行对数转换,以达到正态性,然后计算这些分数的Z分数,这样我就可以在不同等级上测量同一性状的测试之间进行比较。但是,无论我如何建立模型,使用我的数据始终会导致R = 0的可重复性。尽管从技术上讲这是可行的,但我发现它不可能对所有参数都那么低(因为我在不同测试之间进行了比较,并且两次测量相同的测试)。而且,我在运行的每个模型中都会收到一条警告,指出:“边界(奇异)拟合:请参阅?isSingular”。从我收集的数据来看,这意味着我的数据差异可能太小,尽管我对此并不完全确定。而且我担心这可能导致我的R = 0。
我的数据框的片段如下所示:
RNR_ID RoundNR TTC TTC_Z Test_date
2 1 1 28 0.0966013973 43423
114 1 2 14 -0.8138678026 43543
5 2 1 48 0.8045891472 43425
122 2 2 31 0.2302959586 43549
我的模型的两个变体示例: 未经调整的R:
Rep1_Assoc_A <- rpt(TTC_Z ~ RoundNR + (1|RNR_ID), grname = "RNR_ID", data = rpt_Assoc_A_df, datatype = "Gaussian", nboot = 10, npermut = 10)
调整后的R(我控制考试日期,希望能够考虑重复相同考试之间的个人学习情况)
Rep2_Assoc_A <- rpt(TTC_Z ~ RoundNR + Test_date + (1|RNR_ID), grname = "RNR_ID", data = rpt_Assoc_A_df, datatype = "Gaussian", nboot = 10, npermut = 10)
注意:RNR_ID,RoundNR和TTC_Z是数字变量。尽管我不确定模型如何处理,但Test_date以Date格式给出。在此模型中,RoundNR表示“处理”(因为这表示测试是对个人进行的第一次还是第二次评分)。 TTC_Z表示个人的Z分数。
和结果分别为:
Repeatability estimation using the lmm method
Repeatability for RNR_ID
R = 0
SE = 0.107
CI = [0, 0.283]
P = 1 [LRT]
1 [Permutation]
Repeatability estimation using the lmm method
Repeatability for RNR_ID
R = 0
SE = 0.12
CI = [0, 0.337]
P = 1 [LRT]
1 [Permutation]
如前所述,在运行此代码时,控制台向我抛出了几条boundary (singular) fit: see ?isSingular
消息。
我还尝试了一个伪数据集,其中我将所有重复值调整为几乎相同,这确实导致了较高的R(约0.9 ..)。
尽管这似乎表明我的R = 0可能实际上是正确的,但我仍然对此表示怀疑,因为这不仅是意料之外的(我希望至少有一个非常低但可测量的R)。但是由于我对模型缺乏理解,我担心还有其他问题。
总而言之,我的问题是:
Q1:我的模型的当前公式正确吗?变量是正确的数据类型吗?
Q2:在这种情况下boundary (singular) fit: see ?isSingular
是什么意思,我可以“修复”它吗?
Q3:是什么导致我的R = 0?我是错误地分析了我的数据还是我的R真的是0?
答案 0 :(得分:0)
虽然还没有完整的答案,但与一些同事交谈后,我至少对我的问题有部分答案。
Q1:是和否,我设置公式的方式完全可以。但是,我包括了一些不必要的因素(对我而言)。最初,我添加RoundNR作为尝试纠正学习的一个因素。但是,这没有任何意义,因为我只有两轮比赛,因此我相信我所有的变化都应归因于这一因素。取得Z分数就足够了。至于test_date,如果这与我的测试本身没有太大的混淆,那可能会很有趣。尽管更笼统地说(对于其他人):模型的基本思路很好。请注意要包含哪些固定效果。
Q2:我仍然不清楚它的含义,因此,如果其他人可以提供更清晰的解释,那么将不胜感激。但是,据我了解,这仅是我的数据的结果,而不是例如模型的任何问题。
Q3:答案很明显:我自己的数据。一位同事通过另一种方法进行了快速分析(产生的准确度较低,但重复性评估较快),并且还发现R = 0(或至少非常接近)。
不是一个完整的答案,但我希望它能在将来对其他人有所帮助。