如何使用此数据建立物流模型?

时间:2019-04-27 14:34:18

标签: r logistic-regression anova

http://www.statsci.org/data/oz/snails.txt

您可以从此处获取数据。

我的数据是4 * 3 * 3 * 2个完全随机的设计实验数据。我想用刺激变量来模拟生存的可能性。

我尝试了方差分析,但不确定是否正确。 因为我想对“概率”建模,应该使用逻辑模型吗? (我也尝试过逻辑模型。但是数据显示0(生存)和1(死亡)之和。即使它不是0和1,我也可以使用logistic吗?)

我想将“概率”作为Y变量。 因此,我使用了logit,但无法正常工作。 程序说y是Inf。

如何在aov中将logit用作Y变量?

glm_a <- glm(Deaths ~ Exposure + Rel.Hum + Temp + Species, data = data,
         family = binomial)    

prob <- Deaths / 20
logitt <- log(prob / (1 - prob))
logmodel <- lm(logitt ~ data$Species + data$Exposure + data$Rel.Hum + data$Temp)
summary(logmodel)


A <- factor(data$Species, levels = c("A", "B"), labels = c(-1, 1))
glm_a <- glm(Y ~ data$Species * data$Exposure * data$Rel.Hum * data$Temp,
             data=data, family = binomial)
summary(glm_a)

1 个答案:

答案 0 :(得分:0)

help("glm")应该将您定向到help("family"),这将显示以下内容

  

对于二项式和准二项式家庭,可以通过以下三种方式之一指定响应:

     
      
  1. 作为一个因素:“成功”被解释为不具有第一级(因此通常具有第二级)的因素。

  2.   
  3. 作为数值向量,其值在0到1之间,解释为成功案例的比例(总案例数由权重决定)。

  4.   
  5. 作为两列整数矩阵:第一列给出成功次数,第二列给出失败次数。

  6.   

因此,对于“如何使用此数据创建逻辑模型?”这个问题,我们可以很容易地选择3号路线:

data <- read.table("http://www.statsci.org/data/oz/snails.txt", header = TRUE)
glm_a <- glm(cbind(Deaths, N - Deaths) ~ Species * Exposure * Rel.Hum * Temp,
             data = data, family = binomial)
summary(glm_a)
# [output omitted]

关于“我尝试过ANOVA,但不确定是否正确。因为我想对“概率”建模,应该使用逻辑模型吗?”,最好问{{3 }}