检查列中最接近的值

时间:2018-12-18 12:54:13

标签: r dataframe dplyr multiple-columns mutate

有没有一种方法可以检查向量/列中的哪个值最接近给定值?

例如,我的列数为天数: 天:50、49、59、180、170、199、200

我想在数据框中创建一个新列,每当天列的值为183或接近183时将其标记为X

它应该像这样:

DAYS         new column
0            
12
12
14
133
140           X
0
12
14
15
178 
183           X
0
15
30
72
172           X

希望你能帮助我!

1 个答案:

答案 0 :(得分:0)

本质上,您正在搜索局部最大值。首先将数据标准化为目标值(即183),然后搜索最接近零的值。这些是您的局部最大值。我添加的数据的值大于您要演示的目标。

df <- data.frame(DAYS = c(0,12,12,14,133,140,0,12,14,15,178,183,184,190,0,15,30,72,172,172.5))
df$localmin <- abs(df$DAYS - 183)
df

> df
    DAYS localmin
1    0.0    183.0
2   12.0    171.0
3   12.0    171.0
4   14.0    169.0
5  133.0     50.0
6  140.0     43.0
7    0.0    183.0
8   12.0    171.0
9   14.0    169.0
10  15.0    168.0
11 178.0      5.0
12 183.0      0.0
13 184.0      1.0
14 190.0      7.0
15   0.0    183.0
16  15.0    168.0
17  30.0    153.0
18  72.0    111.0
19 172.0     11.0
20 172.5     10.5


targets <- which(diff(sign(diff(c(df$localmin, 183)))) == 2) + 1L
df$targets <- 0
df$targets[targets] <- 1
df

> df
    DAYS localmin targets
1    0.0    183.0       0
2   12.0    171.0       0
3   12.0    171.0       0
4   14.0    169.0       0
5  133.0     50.0       0
6  140.0     43.0       1
7    0.0    183.0       0
8   12.0    171.0       0
9   14.0    169.0       0
10  15.0    168.0       0
11 178.0      5.0       0
12 183.0      0.0       1
13 184.0      1.0       0
14 190.0      7.0       0
15   0.0    183.0       0
16  15.0    168.0       0
17  30.0    153.0       0
18  72.0    111.0       0
19 172.0     11.0       0
20 172.5     10.5       1