我只是想找到一种方法来识别数据集中介于两个值之间的数字。到目前为止我所做的是使用ifelse,即
ifelse(score<=5,1,ifelse(score<=7,2,3))
这已经奏效了,但我想知道你们是否知道找到更好的方法说5&lt; = R&gt; 7,
感谢
詹姆斯
答案 0 :(得分:5)
findInterval
几乎就是你想要的,但是间隔开右边。通过否定视线中的所有内容进行反转,可以给出封闭的右侧间隔。
您的代码:
x <- function(score) ifelse(score<=5,1,ifelse(score<=7,2,3))
findInterval
方法:
y <- function(score) 3 - findInterval(-score, -c(7,5))
结果:
> x(1:20)
[1] 1 1 1 1 1 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3
> y(1:20)
[1] 1 1 1 1 1 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3
答案 1 :(得分:3)
我赞成了@ MatthewLundberg的回答,因为我是findInterval的忠实粉丝,但认为cut
函数可能更容易使用。正如他指出findInterval
中的比较将给你左闭的间隔,而你想要右闭的间隔。右边间隔是cut
默认提供的间隔,除非它们默认标记。您可以使用as.numeric
删除标签:
cut(1:10, c(-Inf, 5,7, Inf) )
[1] (-Inf,5] (-Inf,5] (-Inf,5] (-Inf,5] (-Inf,5] (5,7] (5,7] (7, Inf]
[9] (7, Inf] (7, Inf]
Levels: (-Inf,5] (5,7] (7, Inf]
as.numeric( cut(1:10, c(-Inf, 5,7, Inf) ) )
[1] 1 1 1 1 1 2 2 3 3 3
> get_inter <- function(vec, cutvec){ as.numeric(cut(vec, breaks=c(-Inf,cutvec,Inf) ) ) }
> get_inter(1:10, c(5,7) )
[1] 1 1 1 1 1 2 2 3 3 3
答案 2 :(得分:2)
只需使用矢量化比较:
# generate some repeatable numbers
set.seed(1492)
score <- sample(1:10, 25, replace=TRUE)
# show the numbers
print(score)
[1] 3 3 2 2 1 1 9 6 4 8 7 7 2 6 6 8 2 4 7 10 7 4 2 6 1
# printing the value + compare result just to show that it works
# you can do ifelse((score <= 5 | score > 7), something, somethingelse)
print(data.frame(score=score, tst=(score <= 5 | score > 7)))
score tst
1 3 TRUE
2 3 TRUE
3 2 TRUE
4 2 TRUE
5 1 TRUE
6 1 TRUE
7 9 TRUE
8 6 FALSE
9 4 TRUE
10 8 TRUE
11 7 FALSE
12 7 FALSE
13 2 TRUE
14 6 FALSE
15 6 FALSE
16 8 TRUE
17 2 TRUE
18 4 TRUE
19 7 FALSE
20 10 TRUE
21 7 FALSE
22 4 TRUE
23 2 TRUE
24 6 FALSE
25 1 TRUE
答案 3 :(得分:1)
如果你知道它的整数,%in%
是一个很好的语法糖:
R>x <- 1:10
R>x %in% 5:8
[1] FALSE FALSE FALSE FALSE TRUE TRUE TRUE TRUE FALSE FALSE