如何计算rstudio中的样本量 - 逻辑回归

时间:2021-06-01 23:59:00

标签: r logistic-regression

rstudio 中如何计算样本量。我见过样本 set.seed(1000)、set.seed(888) 等。它是否与观察次数有关?我找到了此链接 Power and sample size calculations,但我不知道该函数需要什么输入值。

例如。 power.t.test(delta=.25,sd=0.7,power=.80)

函数的输入:

n – 每组样本量

delta – 两个总体均值之间的差异

sd – 标准差

power – 所需的功率,作为一个比例(0 和 1 之间)

2 个答案:

答案 0 :(得分:1)

问题中的链接指向t.test 的功效计算,但问题是关于逻辑回归。此外,ex.power.t.test 似乎也用于 t 检验,而不是 GLM。

通常有两种功效分析方法:

  1. 使用特定于方法的公式进行确定性估计,通常带有优化步骤
  2. 使用给定方法和一定数量的试验进行模拟,例如1000。在后一种情况下,样本大小很重要,随机数生成器的初始化也有些重要,用 set.seed 指定。

只要稍加编程,您就可以轻松地自行设置模拟。

另一方面,pwr 包中的函数 pwr.f2.test 可以轻松获得 GLM 和其他模型的功效分析。根据帮助文件:

"参数 'u'、'v'、'f2'、'power' 和 'sig.level' 中的一个必须作为 NULL 传递,并且该参数由其他参数确定。注意最后一个具有非 NULL 默认值,因此如果要计算它,则必须显式传递 NULL。"

这是文档中的示例:

pwr.f2.test(u=5,v=89,f2=0.1/(1-0.1),sig.level=0.05)

但如果您想根据功效计算显着性水平,请使用:

pwr.f2.test(u=5, v=89, f2=0.1/(1-0.1), sig.level=NULL, power=0.8)

可以在文档中找到更多详细信息,尤其是在 package vignette 中。

答案 1 :(得分:0)

谢谢两位。我误解了链接参考。 set.seed(n) 中的 n 只是一个随机数。它不应该过于频繁地设置/重置为另一个随机数。它是指定的,以便其他人可以重现相同的结果。它似乎不是基于观察次数或其他任何东西。