我想根据使用试验数据进行的模拟估算所需的研究样本量。我的模型如下:
model1 <- glmer(decision ~ 1 + default + aest + obstruc + privatt + (1 + default + aest + obstruc | id), family = 'binomial', data = pilot_data)
simR软件包可以扩展给定的数据集,然后在Powercurve中可视化的情况下,在增加的数量的不同阶段(在我的情况下为参与者的数量)计算模型的功效。我不想同时测试一个固定效果(通过fixed
函数),而是想同时对我的三个主要效果运行powerCurve
(主要效果是:default,aest和obstruc; privatt是一个控制变量) 。
我的想法是使用fcompare
函数并将我的完整模型与一个空模型(只有截距)进行比较。
我的问题是:此程序在统计上是否正确?最后,我想检查功率曲线达到80%的位置并招募到相应数量的参与者。
扩展数据集并生成powercurve的代码如下:
model1_ext <- extend(model1, along='id', n='250')
pc_model1 <- powerCurve(model1_ext, fcompare(~ 1, method = 'pb'), along='id', nsim=1000 )
答案 0 :(得分:0)
我怀疑您会低估所需的样本量。
您要提出的测试要求“所有这些影响加在一起是否显着?”。但是,如果您想知道特定效果是否显着,您需要从数据中查询更多信息,因此可能需要更大的样本量。
您的样本量通常由“最难”的问题决定,因此,我建议为每种效果绘制一条独立的功效曲线。
如果您在模拟时间上遇到麻烦,可以使用'kr'
而不是'pb'
。分析已经是一种近似(因为我们永远不知道我们用于模拟的参数的“真实”值)。如果您担心这两个测试可能会得出不同的结果,则可以在一次'pb'
中使用powerSim
仔细检查建议的样本量。