计算校正因子

时间:2018-09-18 22:09:10

标签: r regression linear-regression correlation

我有一个变量,我怀疑它受温度的影响,我想计算一个校正因子来说明温度的影响。

因此给出温度数据的时间序列:

Temp<-c(23.545, 23.475, 23.382, 23.328, 23.251, 23.247, 23.241, 23.227, 23.146,
 23.133, 23.127, 23.567, 23.561, 23.521, 23.496, 23.348, 23.274, 23.270,
 23.258, 23.244, 23.158, 23.152, 23.132, 23.123, 23.083, 23.025, 22.999,
 22.666, 22.330, 22.072, 21.794, 21.532, 21.063, 20.742, 19.183, 18.556,
 17.165, 15.233, 13.844, 12.818, 12.236, 11.914)

有关的变量:

var<-c(0.080, -0.003, -0.018, -0.035,  0.005, -0.023,  0.080,  0.035,  0.065,
 -0.055, -0.030, -0.038,  0.010,  0.013,  0.018, -0.033, -0.028,  0.105,
 -0.085,  0.010,  0.018, -0.065, -0.048, -0.013, -0.103, -0.013,  0.002,
 0.053, -0.018,  0.080,  0.057,  0.083,  0.060,  0.085,  0.158,  0.155,
 0.232,  0.245,  0.390,  0.400,  0.568,  0.508)

我可以将两者绘制在一起,以查看temp对var的影响

plot(Temp,var) 

我在22.330有一个Temp观测值,我知道是正确的。因此,我想通过以下一种校正因子来调整var数据:

A-所有var值都接近相同值,并且大部分差异是由于温度造成的

B- 22.330处的点是正确的,应该相应地校正上下的值

1 个答案:

答案 0 :(得分:1)

也许这是一个起点。

让我们从拟合线性模型var ~ Temp

开始
fit <- lm(var ~ Temp)

除了人为地迫使模型经过一个或多个特定点外,我看不到使用加权线性模型的要点。数据就是它们的本质,格式为var ~ Temp的线性模型将表征varTemp之间的一般线性相关性。

让我们在data.frame中合并数据,并添加一个Time列以及线性模型拟合中的残差。

df <- cbind.data.frame(Time = 1:length(Temp), Temp, var, resid = fit$residuals)

我们显示以下图:

library(gridExtra)
gg1 <- ggplot(df, aes(Time, var)) + geom_point()
gg2 <- ggplot(df, aes(Temp, var)) + geom_point()
gg3 <- ggplot(df, aes(Time, resid)) + geom_point()
grid.arrange(gg1, gg2, gg3, nrow = 1)

enter image description here

  1. 左侧面板显示varTime的依赖性。
  2. 中间面板显示了varTemp的依赖性,您假设存在这种依赖性。
  3. 在校正了varTime的线性相关性之后,右面板显示了varTemp的残余影响。

换句话说,您可以将残差视为var校正后的Temp值。它们描述了var中没有解释的Temp中的可变性。