我想比较两个向量元素,以检查第一个向量中某个位置的元素是否与第二个向量中相同位置的元素不同。
关键是我在向量中有NA
个值,在对这些值进行比较时,我得NA
而不是TRUE
或FALSE
。
可重复示例:
这是我得到的:
a<-c(1, NA, 2, 2, NA)
b<-c(1, 1, 1, NA, NA)
a!=b
[1] FALSE TRUE NA NA NA
以下是我希望!=
运算符的工作方式(将NA
值视为变量的另一个“级别”):
a!=b
[1] FALSE TRUE TRUE TRUE FALSE
this link有一个可能的解决方案,但是这个人正在创建一个执行任务的功能。我想知道是否有更优雅的方式来做到这一点。
答案 0 :(得分:5)
利用以下事实:
T & NA = NA
但
F & NA = F
和
F | NA = NA
但
T | NA = T
以下解决方案可行,并仔细放置括号:
(a != b | (is.na(a) & !is.na(b)) | (is.na(b) & !is.na(a))) & !(is.na(a) & is.na(b))
您可以定义:
`%!=na%` <- function(e1, e2) (e1 != e2 | (is.na(e1) & !is.na(e2)) | (is.na(e2) & !is.na(e1))) & !(is.na(e1) & is.na(e2))
然后使用:
a %!=na% b
答案 1 :(得分:4)
来自http://www.cookbook-r.com/Manipulating_data/Comparing_vectors_or_factors_with_NA/:
# This function returns TRUE wherever elements are the same, including NA's,
# and FALSE everywhere else.
compareNA <- function(v1,v2) {
same <- (v1 == v2) | (is.na(v1) & is.na(v2))
same[is.na(same)] <- FALSE
return(same)
}
我喜欢这个,因为它非常简单,而且很容易看出它的作用。
答案 2 :(得分:2)
我们可以使用值v1
动态替换NA值,这两个值都不存在于!=
f1 <- function(x, y) {
v1 <- setdiff(1:1000, na.omit(unique(c(x,y))))[1]
replace(x, is.na(x), v1) != replace(y, is.na(y), v1)
}
f1(a,b)
#[1] FALSE TRUE TRUE TRUE FALSE
f1(a1,b1)
#[1] TRUE TRUE TRUE
f1(a2,b2)
#[1] FALSE TRUE TRUE FALSE
a <- c(1, NA, 2, 2, NA)
b<-c(1, 1, 1, NA, NA)
a1 <- c(NA, 1, NA)
b1 <- c(2, NA, 3)
a2<-c(1,NA,2,NA)
b2<-c(1,1,3,NA)