使用二次多项式和直线的分段回归

时间:2017-03-07 04:05:03

标签: r regression curve-fitting

我正在尝试按照此示例Segmented Regression, Breakpoint analysis实施分段回归。

现在,我怎么能以这样的方式实现它,第二部分将是二次多项式,其余的是相同的。

我尝试通过更改Z= ~poly(DistanceMeters, 2)来尝试相同的操作但不起作用。

另外,我怎样才能得到像

这样的方程式
part 1: a1*x+b1
part 2: a2*x2**2 + b2*x + c1
part 3 :a3*x + b3

有类似的问题,但他们无法解释使用分段函数。

1 个答案:

答案 0 :(得分:3)

我有两个想法,都有缺点。也许你可以根据自己的需要调整其中一个。遗憾的是此刻无法访问云端硬盘,因此使用了一些人工数据。

<强> 1。 “手动”拟合多项式模型

在这里你可以指定你喜欢的模型,有些段可以是lm,有些是多项式等。

代码:

library(segmented)
library(ggplot2)
library(data.table)

# Data
set.seed(12)
xx <- 1:100
yy <- 2 + 1.5 * pmax(xx-35, 0) - 1.5 * pmax(xx-70, 0) + 15 * pmax(runif(100) - 0.5, 0) + rnorm(100, 0, 2)

dt <- data.table(x = xx, y = yy, type = 'act')
dt_all <- copy(dt)

# lm
lm_lin <- lm(y ~ x, data = dt)
summary(lm_lin)

# Find segments
lm_seg <- segmented(
  lm_lin, seg.Z = ~ x, psi = list(x = c(30, 80)))

# "Manual" lm's
breaks <- unname(lm_seg$psi[, 'Est.'])
lm_poly1 <- lm(y ~ poly(x, 4), data = dt[x < breaks[1], ])
lm_2 <- lm(y ~ x, data = dt[x > breaks[1] & x < breaks[2], ])
lm_poly3 <- lm(y ~ poly(x, 4), data = dt[x > breaks[2], ])

dt_all <- rbind(
  dt_all,
  data.table(x = xx, y = c(
    predict(lm_poly1),
    predict(lm_2),
    predict(lm_poly3)),
    type = 'lm_poly'
  )
)

<强> 2。使用segmented和某些样条线

的中断来调整gam模型

在这里,您将获得各个细分之间的平滑过渡,但您对所发生的事情的控制要少得多。

# Using splines for smooth segments
library(mgcv)

spl <- gam(y ~ s(x, bs = "cc", k = 12), data = dt, knots = list(xx = breaks))

# Plot
dt_all <- rbind(dt_all, data.table(x = xx, y = predict(spl), type = 'spl'))
ggplot(dt_all, aes(x = x, y = y)) + geom_point(size = 1) +
  facet_grid(. ~ type) + theme_minimal()

enter image description here

两者都可以使用例如list()lapply()自动化一点(不同的休息时间等)。

修改

通过更改polys的参数,您可以获得略微“更好”的拟合模型,但对于gam边缘上的误差非常大,请参阅degree = 6k = 30

enter image description here