我正在尝试模拟在多元线性回归分析中显示一个二进制(exp。条件)和一个连续变量之间相互作用影响的数据集,以便估算达到给定统计功效所需的样本量。
我为此目的编写了一个函数,但是我不确定是否还会创建所需的数据,因为连续预测变量似乎是效果依赖的唯一变量。
我想念什么吗?
该函数如下所示:
simulateDataset <- function(sampleSize, beta1,beta2,beta3) {
#create two conditions w/ equal sample size
x1 <- c(rep(0, sampleSize/2), rep(1,sampleSize/2))
#create normally distributed centered variable
x2 <- rnorm(sampleSize,0,1)
#create normally distributed residuals
res <- rnorm(sampleSize,0,1)
#create dependent variable
y <- beta1*x1 + beta2*x2 + beta3*(x1*x2) + res
dataset <- as.data.frame(cbind(x1, x2, y),
c(x1, x2, y))
return(dataset)
}