我有一个变量,我怀疑它受温度的影响,我想计算一个校正因子来说明温度的影响。
因此给出温度数据的时间序列:
Temp<-c(23.545, 23.475, 23.382, 23.328, 23.251, 23.247, 23.241, 23.227, 23.146,
23.133, 23.127, 23.567, 23.561, 23.521, 23.496, 23.348, 23.274, 23.270,
23.258, 23.244, 23.158, 23.152, 23.132, 23.123, 23.083, 23.025, 22.999,
22.666, 22.330, 22.072, 21.794, 21.532, 21.063, 20.742, 19.183, 18.556,
17.165, 15.233, 13.844, 12.818, 12.236, 11.914)
有关的变量:
var<-c(0.080, -0.003, -0.018, -0.035, 0.005, -0.023, 0.080, 0.035, 0.065,
-0.055, -0.030, -0.038, 0.010, 0.013, 0.018, -0.033, -0.028, 0.105,
-0.085, 0.010, 0.018, -0.065, -0.048, -0.013, -0.103, -0.013, 0.002,
0.053, -0.018, 0.080, 0.057, 0.083, 0.060, 0.085, 0.158, 0.155,
0.232, 0.245, 0.390, 0.400, 0.568, 0.508)
我可以将两者绘制在一起,以查看temp对var的影响
plot(Temp,var)
我在22.330有一个Temp观测值,我知道是正确的。因此,我想通过以下一种校正因子来调整var数据:
A-所有var值都接近相同值,并且大部分差异是由于温度造成的
B- 22.330处的点是正确的,应该相应地校正上下的值
答案 0 :(得分:1)
也许这是一个起点。
让我们从拟合线性模型var ~ Temp
fit <- lm(var ~ Temp)
除了人为地迫使模型经过一个或多个特定点外,我看不到使用加权线性模型的要点。数据就是它们的本质,格式为var ~ Temp
的线性模型将表征var
和Temp
之间的一般线性相关性。
让我们在data.frame
中合并数据,并添加一个Time
列以及线性模型拟合中的残差。
df <- cbind.data.frame(Time = 1:length(Temp), Temp, var, resid = fit$residuals)
我们显示以下图:
library(gridExtra)
gg1 <- ggplot(df, aes(Time, var)) + geom_point()
gg2 <- ggplot(df, aes(Temp, var)) + geom_point()
gg3 <- ggplot(df, aes(Time, resid)) + geom_point()
grid.arrange(gg1, gg2, gg3, nrow = 1)
var
对Time
的依赖性。var
对Temp
的依赖性,您假设存在这种依赖性。var
对Time
的线性相关性之后,右面板显示了var
对Temp
的残余影响。换句话说,您可以将残差视为var
校正后的Temp
值。它们描述了var
中没有解释的Temp
中的可变性。