在几行

时间:2017-04-10 19:27:40

标签: r interpolation linear-interpolation

我有14个不同行的截距和斜率y = Slope * x + Intercept。这些线或多或少地平行如下。每一行代表某一类。

   Intercept     Slope
1   8.787611 -3.435561
2   6.853230 -2.662021
3   6.660198 -2.584231
4   6.929856 -2.678694
5   6.637965 -2.572499
6   7.132044 -2.744441
7   7.233281 -2.802287
8   7.285169 -2.807539
9   7.207577 -2.772140
10  6.872071 -2.640098
11  6.778350 -2.612107
12  6.994820 -2.706729
13  6.947074 -2.690497
14  7.486870 -2.864093

当新数据以(x, y)的形式出现时。我想做两件事:

1)找出最接近该点的线(e.x。' 1',' 4'或' 8')

2)在x = 2.6处找到插值。这意味着如果某个点位于两条线之间,并且这些线的0-0.05的值为x = 2.6,则插值将与[-0.05, 0]成比例距离线的距离。

      x         y
1  2.545726 0.1512721
2  2.545726 0.1512721
3  2.545843 0.1512721
4  2.545994 0.1512721
5  2.546611 0.1512721
6  2.546769 0.1512721
7  2.546995 0.1416945
8  2.547269 0.1416945
9  2.548765 0.1416945
10 2.548996 0.1416945

我正在考虑编写自己的代码并使用this Wikipedia page从14行找到新点的距离,然后选择点上方和下方的两条最小距离(如果该点不在上方或低于所有14行),并按比例插值。但是,我很确定这不会是最快的方式,因为它没有矢量化。我想知道是否有更快的方法来完成这项任务。

1 个答案:

答案 0 :(得分:2)

enter image description here

lines <- read.table(textConnection("
   Intercept     Slope
1   8.787611 -3.435561
2   6.853230 -2.662021
3   6.660198 -2.584231
4   6.929856 -2.678694
5   6.637965 -2.572499
6   7.132044 -2.744441
7   7.233281 -2.802287
8   7.285169 -2.807539
9   7.207577 -2.772140
10  6.872071 -2.640098
11  6.778350 -2.612107
12  6.994820 -2.706729
13  6.947074 -2.690497
14  7.486870 -2.864093"))


points <- read.table(textConnection("
      x         y
1  2.545726 0.1512721
2  2.545726 0.1512721
3  2.545843 0.1512721
4  2.545994 0.1512721
5  2.546611 0.1512721
6  2.546769 0.1512721
7  2.546995 0.1416945
8  2.547269 0.1416945
9  2.548765 0.1416945
10 2.548996 0.1416945"))

cartDist <- function(lines, x, y) {
    with(lines, abs(Slope*x-y+Intercept)/sqrt(Slope^2+1))
}

interp_ys <- sapply(1:nrow(points), function(i) {
    x <- points$x[i]
    y <- points$y[i]
    dists <- cartDist(lines, x, y)
    dr <- rank(dists)
    wh <- which(dr %in% c(1,2))
    ys <- with(lines[wh,], Slope*2.6+Intercept)
    sum(((sum(dists[wh]) - dists[wh]) * ys))/sum(dists[wh]) #weighted average
})

plot(NA, ylim=c(-0.01,0.16), xlim=c(2.53,2.61), xlab="x", ylab="y", main="Interpolated points")
for(i in 1:nrow(lines)) {
    abline(b=lines$Slope[i], a=lines$Intercept[i], col="gray")
}
points(x=points$x, y=points$y, col="red")
points(x=rep(2.6, nrow(points)), y=interp_ys, col="blue")
segments(x0=rep(2.6, nrow(points)), y0=interp_ys, x1=points$x, y1=points$y, lty=2,col="black")