当我剪切一个树状图树时:
## 4. 3-cluster solution
cl.hw3 <- cutree(cl.ward, k=3)
然后尝试对其进行逻辑回归:
## 7. Logistic regression
cl1 <- as.numeric(cl.hw3==2)
logreg1 <- glm(cl1 ~ sex + birthyr + plingu02, family=binomial, data=biofam)
summary(logreg1)
在第一步中发生了什么(cl1&lt; - as.numeric(cl.hw3 == 1)??赋值运算符==用我给出的数字(2而不是3)重新计算树形图树簇在这种情况下)?
答案 0 :(得分:2)
在您的示例中,cl.hw3==2
返回值为TRUE
和FALSE
的逻辑。
as.numeric(cl.hw3==2)
将TRUE
替换为1,将FALSE
替换为0,将逻辑转换为数字变量。
设置as.numeric(cl.hw3==3)
不会以不同方式切割树。它只是定义了属于第三组而不是第二组的结果指示变量。
然后逻辑回归将是属于第三个群集的概率。
希望这有帮助。