意图包括找出洗衣机故障的因果关系(0,1)。逻辑分布的命令创建了随机变量,除了因变量都是1.来自其他逻辑分布的模拟创建了随机0和1值。
变量,Hrs2,WashCap和SpinSp创建为n = 3000的正态分布。我改变了平均值和SD,以便在直方图的x轴上拟合所需的间隔。
# Hours2
set.seed(600)
Hrs2 <- rnorm(3000, mean=300, sd=100)
#WashCap
set.seed(5)
WashCap <- rnorm(3000, mean=2.5, sd=1)
#SpinSp
set.seed(1100)
SpinSp <- rnorm(3000, mean=550, sd=250)
逻辑分布的差异包括具有偏差的线性组合的附加变量。
z=1 + 2*Hrs2 + 3*WashCap + 4*SpinSp
pr = 1/(1+exp(-z))
y <- rbinom(3000,1,pr)
WashMa = data.frame(y=y, Hrs2=Hrs2, WashCap=WashCap, SpinSp=SpinSp)
glm( y~Hrs2+WashCap+SpinSp,data=WashMa, family=binomial)
有关修复因变量以创建变体的想法吗?