在R中具有比例的逻辑回归(因变量不是二进制)。 R在做什么?

时间:2018-10-31 06:02:42

标签: r logistic-regression

所以我偶然发现了以下代码:

#Importing the data:
seeds.df <- 
read.table('http://www.uib.no/People/nzlkj/statkey/data/seeds.csv',header=T)
attach(seeds.df)

#Making a plot of seeds eaten depending on seed type:
plot(Seed.type, Eaten)

#Testing the hypothesis:
fit1.glm <- glm(cbind(Eaten,Not.eaten)~Seed.type, binomial)
summary(fit1.glm)

来自https://folk.uib.no/nzlkj/statkey/logistic.html#proportions

提供了一种对比例数据进行逻辑回归的方法。

我的问题是R在数学上实际上在做什么?响应变量是两列。据我所知,应该对二进制因变量执行逻辑回归。

是R创建一个新的长度为Eaten + Not.eaten的响应变量 由rep(1,Eaten)rep(0,Not.eaten)填充并对其执行对数回归?

例如种子中的第1行。dfEaten = 2 Not.eaten = 48

row#    eaten.or.not    seed.type    Hamster
1        1                 B            1
2        1                 B            1
3        0                 B            1
         0                 B            1 
     ...                  
50       0                 B            1 

然后R会做glm(吃或不吃〜种子类型,family ='binomial')

我测试了上面的内容,但没有得到相同的答案

或者R正在执行以下操作

ln(被吃掉的概率/(1-被吃掉的概率))=截距+ B1(种子类型)

我也对此进行了测试,但有所不同,但是我不确定我是否正确完成了操作。

无论如何,有人能以很大的比例阐明R在对数回归方面的数学运算。

谢谢您的时间

0 个答案:

没有答案