我想用回归线做一个泡沫情节来分析我确实预测了希拉里克林顿对伯尼桑德斯在每个县民主小学中的投票比例。但是,geom_smooth()不断创建具有错误斜率和截距的线。 lm out put是这样的:
Estimate Std. Error t-value p-value
(Intercept) 0.146790 0.058166 2.524 0.011737 *
AssoCareer -0.102984 0.020378 -5.054 4.97e-07 ***
但图表看起来像这样:
我的代码如下所示:
ggplot(data, aes(x=AssoCareer, y=Prop.H, color="green")) +
geom_point(aes(size =Bins, shape="solid",alpha=.2),pch=21, bg='cyan1') +
geom_text(hjust = 1, size = 2, label=' ') +
coord_cartesian(ylim=c(0,1.5)) +
geom_smooth(method="lm", na.rm=T)+
xlab("County Level Explicit Association Career-Men")+
ylab("Proportion of Hillary Voters")+
ggtitle(paste('Proportion of votes for Clinton over Bernie'))
有人能说出为什么会发生这种情况吗?