所以我偶然发现了以下代码:
#Importing the data:
seeds.df <-
read.table('http://www.uib.no/People/nzlkj/statkey/data/seeds.csv',header=T)
attach(seeds.df)
#Making a plot of seeds eaten depending on seed type:
plot(Seed.type, Eaten)
#Testing the hypothesis:
fit1.glm <- glm(cbind(Eaten,Not.eaten)~Seed.type, binomial)
summary(fit1.glm)
来自https://folk.uib.no/nzlkj/statkey/logistic.html#proportions
提供了一种对比例数据进行逻辑回归的方法。
我的问题是R在数学上实际上在做什么?响应变量是两列。据我所知,应该对二进制因变量执行逻辑回归。
是R创建一个新的长度为Eaten + Not.eaten的响应变量 由rep(1,Eaten)rep(0,Not.eaten)填充并对其执行对数回归?
例如种子中的第1行。dfEaten = 2 Not.eaten = 48
row# eaten.or.not seed.type Hamster
1 1 B 1
2 1 B 1
3 0 B 1
0 B 1
...
50 0 B 1
然后R会做glm(吃或不吃〜种子类型,family ='binomial')
我测试了上面的内容,但没有得到相同的答案
或者R正在执行以下操作
ln(被吃掉的概率/(1-被吃掉的概率))=截距+ B1(种子类型)
我也对此进行了测试,但有所不同,但是我不确定我是否正确完成了操作。
无论如何,有人能以很大的比例阐明R在对数回归方面的数学运算。
谢谢您的时间