在R中的两个数字之间,即5 = R 7

时间:2014-04-18 22:51:59

标签: r

我只是想找到一种方法来识别数据集中介于两个值之间的数字。到目前为止我所做的是使用ifelse,即

ifelse(score<=5,1,ifelse(score<=7,2,3))

这已经奏效了,但我想知道你们是否知道找到更好的方法说5&lt; = R&gt; 7,

感谢

詹姆斯

4 个答案:

答案 0 :(得分:5)

findInterval几乎就是你想要的,但是间隔开右边。通过否定视线中的所有内容进行反转,可以给出封闭的右侧间隔。

您的代码:

x <- function(score) ifelse(score<=5,1,ifelse(score<=7,2,3))

findInterval方法:

y <- function(score) 3 - findInterval(-score, -c(7,5))

结果:

> x(1:20)
 [1] 1 1 1 1 1 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3
> y(1:20)
 [1] 1 1 1 1 1 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3

答案 1 :(得分:3)

我赞成了@ MatthewLundberg的回答,因为我是findInterval的忠实粉丝,但认为cut函数可能更容易使用。正如他指出findInterval中的比较将给你左闭的间隔,而你想要右闭的间隔。右边间隔是cut默认提供的间隔,除非它们默认标记。您可以使用as.numeric删除标签:

 cut(1:10, c(-Inf, 5,7, Inf) )
 [1] (-Inf,5] (-Inf,5] (-Inf,5] (-Inf,5] (-Inf,5] (5,7]    (5,7]    (7, Inf]
 [9] (7, Inf] (7, Inf]
Levels: (-Inf,5] (5,7] (7, Inf]

as.numeric( cut(1:10, c(-Inf, 5,7, Inf) ) )
 [1] 1 1 1 1 1 2 2 3 3 3

> get_inter <- function(vec, cutvec){ as.numeric(cut(vec, breaks=c(-Inf,cutvec,Inf) ) ) }
> get_inter(1:10, c(5,7) )
 [1] 1 1 1 1 1 2 2 3 3 3

答案 2 :(得分:2)

只需使用矢量化比较:

# generate some repeatable numbers
set.seed(1492)
score <- sample(1:10, 25, replace=TRUE)

# show the numbers
print(score)
[1]  3  3  2  2  1  1  9  6  4  8  7  7  2  6  6  8  2  4  7 10  7  4  2  6  1

# printing the value + compare result just to show that it works
# you can do ifelse((score <= 5 | score > 7), something, somethingelse)

print(data.frame(score=score, tst=(score <= 5 | score > 7)))
   score   tst
1      3  TRUE
2      3  TRUE
3      2  TRUE
4      2  TRUE
5      1  TRUE
6      1  TRUE
7      9  TRUE
8      6 FALSE
9      4  TRUE
10     8  TRUE
11     7 FALSE
12     7 FALSE
13     2  TRUE
14     6 FALSE
15     6 FALSE
16     8  TRUE
17     2  TRUE
18     4  TRUE
19     7 FALSE
20    10  TRUE
21     7 FALSE
22     4  TRUE
23     2  TRUE
24     6 FALSE
25     1  TRUE

答案 3 :(得分:1)

如果你知道它的整数,%in%是一个很好的语法糖:

R>x <- 1:10
R>x %in% 5:8
 [1] FALSE FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE FALSE FALSE