我正在使用汽车数据集(来自ggplot2)并在散点图中绘制了对抗dist的列速度。现在我想为散点图的分布拟合不同的模型(如指数)。我找到了各种方法来检查数据行(单变量)如何分配到某个分布(qqplot或MASS中的fitdistr),但我不知道如何将这些函数用于散点图或在案例中调查两个变量的相关性。
答案 0 :(得分:2)
喜欢这个吗?
library(ggplot2)
df <- cars
fit <- nls(speed ~ a * (1-exp(b*dist)),cars,start=c(a=1,b=.01),algorithm="port")
df$speed.pred <- predict(fit)
ggplot(df, aes(x=dist))+
geom_point(aes(y=speed))+
geom_line(aes(y=speed.pred),linetype=2, colour="blue")
请注意,此公式将dist
视为0错误的预测变量。换句话说,我们假设speed
有error ~ N[0,sigma]
,但dist
没有错误。如果您认为speed
和dist
都有错误,那么这是much more complicated problem,并且通常的OLS技术不适用。