Stata的inlist允许我们引用变量的实数或字符串值。我想知道R
是否具有这样的功能。
示例:
我想从变量state
中选择八种状态(在state
取50个字符串值(美国州)的任何数据帧中,您可以将其视为列state
。
inlist(state,"NC","AZ","TX","NY","MA","CA","NJ")
我想从变量age
中选择九个年龄值(在age
取0到90之间的数值时,您可以将其视为列age
。< / p>
inlist(age,16, 24, 45, 54, 67,74, 78, 79, 85)
问题:
age<-c(0:10) # for this problem age takes values from 0 to 10 only
data<-as.data.frame(age) # age is a variable of data frame data
data$m<-ifelse(c(1,7,9)%in%data$age,0,1) # generate a variable m which takes value 0 if age is 1, 7, and 8 and 1, otherwise
Expected output:
age m
1 0 1
2 1 0
3 2 1
4 3 1
5 4 1
6 5 1
7 6 1
8 7 0
9 8 1
10 9 0
11 10 1
答案 0 :(得分:5)
我想你想要%in%
:
statevec <- c("NC","AZ","TX","NY","MA","CA","NJ")
state <- c("AZ","VT")
state %in% statevec ## TRUE FALSE
agevec <- c(16, 24, 45, 54, 67,74, 78, 79, 85)
age <- c(34,45)
age %in% agevec ## FALSE TRUE
修改:处理更新的问题。
从@ NickCox的链接复制:
inlist(z,a,b,...)
Domain: all reals or all strings
Range: 0 or 1
Description: returns 1 if z is a member of the remaining arguments;
otherwise, returns 0. All arguments must be reals
or all must be strings. The number of arguments is
between 2 and 255 for reals and between 2 and 10 for
strings.
但是,我不太确定这与原始问题的匹配程度如何。我不太了解Stata,知道z
是否可以是一个向量:它听起来不是那样的,在这种情况下,原始问题(将z=state
视为向量)并不是'有道理。如果我们认为可以是一个向量,那么答案就是as.numeric(state %in% statevec)
- 我认为。
修改: Ananda更新
使用您的更新数据,这是一种方法,再次使用%in%
:
data <- data.frame(age=0:10)
within(data, {
m <- as.numeric(!age %in% c(1, 7, 9))
})
age m
1 0 1
2 1 0
3 2 1
4 3 1
5 4 1
6 5 1
7 6 1
8 7 0
9 8 1
10 9 0
11 10 1
这与您的预期输出相匹配,方法是使用!
(NOT)来反转%in%
的意义。从我想到它的方式看起来有点倒退(通常,0 = FALSE
=“不在列表中”并且1 = TRUE
=“在列表中”)我读到Stata的定义,但如果它是你想要的......
或者可以使用ifelse
获得更大的潜在灵活性(即0/1以外的值):在上面的代码中替换within(data, { m <- ifelse(age %in% c(1, 7, 9),0,1)})
。