使用R预测概率

时间:2012-11-10 23:15:17

标签: r

我在R中创建的模型是:

fit <- lm(hired ~ educ + exper + sex, data=data)

我不确定的是如何拟合模型以预测感兴趣的概率,其中p = pr(雇用= 1)。

任何帮助将不胜感激,谢谢, 粘土

编辑: 那么glm在我的模型中扮演什么角色呢?(我的回答如下)基于Jason对Greg的回答所做的编辑我不明白它具体做了什么。

我的回答是否分析了被录用的可能性?

2 个答案:

答案 0 :(得分:6)

对于使用glm估算的模型,您可以使用predict函数为数据集中的每个观测值提取线性预测变量。然后,您可以简单地使用适当的概率分布函数来获得预测概率。例如,在逻辑回归的情况下,使用plogis。换句话说,如果您的模型mod适合glm

> plogis(predict(mod))
假设您估计了逻辑模型,

将返回数据集中每个观测值的预测概率。如果您需要计算不在数据集中的点的预测概率,请参阅newdata的{​​{1}}选项。请注意,predict也可以在每个点提供标准错误。有关详细信息,请查看predict的文档。

编辑:根据Greg的建议,您可以在predict.glm的来电中使用type="response"免费获取predict

plogis

答案 1 :(得分:0)

所以我尽力解释我发现的glm音符,这就是我想出来的。

 > test<-glm(hired ~ educ + exper + sex, data=data, family=binomial())
 > summary(test)

 Call:
 glm(formula = hired ~ educ + exper + sex, family = binomial(), 
     data = data)

 Deviance Residuals: 
     Min       1Q   Median       3Q      Max  
 -1.4380  -0.4573  -0.1009   0.1294   2.1804  

 Coefficients:
             Estimate Std. Error z value Pr(>|z|)  
 (Intercept) -14.2483     6.0805  -2.343   0.0191 *
 educ          1.1549     0.6023   1.917   0.0552 .
 exper         0.9098     0.4293   2.119   0.0341 *
 sex           5.6037     2.6028   2.153   0.0313 *
 ---
 Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 

 (Dispersion parameter for binomial family taken to be 1)

     Null deviance: 35.165  on 27  degrees of freedom
 Residual deviance: 14.735  on 24  degrees of freedom
 AIC: 22.735

 Number of Fisher Scoring iterations: 7