如何在R

时间:2016-06-03 08:55:14

标签: arrays r na

我想比较两个向量元素,以检查第一个向量中某个位置的元素是否与第二个向量中相同位置的元素不同。
关键是我在向量中有NA个值,在对这些值进行比较时,我得NA而不是TRUEFALSE

可重复示例:

这是我得到的:

a<-c(1, NA, 2, 2, NA)
b<-c(1, 1, 1, NA, NA)
a!=b
[1] FALSE   TRUE   NA   NA   NA  

以下是我希望!=运算符的工作方式(将NA值视为变量的另一个“级别”):

a!=b
[1] FALSE   TRUE   TRUE   TRUE   FALSE

this link有一个可能的解决方案,但是这个人正在创建一个执行任务的功能。我想知道是否有更优雅的方式来做到这一点。

3 个答案:

答案 0 :(得分:5)

利用以下事实:

T & NA = NAF & NA = F

F | NA = NAT | NA = T

以下解决方案可行,并仔细放置括号:

(a != b | (is.na(a) & !is.na(b)) | (is.na(b) & !is.na(a))) & !(is.na(a) & is.na(b))

您可以定义:

`%!=na%` <- function(e1, e2) (e1 != e2 | (is.na(e1) & !is.na(e2)) | (is.na(e2) & !is.na(e1))) & !(is.na(e1) & is.na(e2))

然后使用:

a %!=na% b

答案 1 :(得分:4)

来自http://www.cookbook-r.com/Manipulating_data/Comparing_vectors_or_factors_with_NA/

# This function returns TRUE wherever elements are the same, including NA's,
# and FALSE everywhere else.
compareNA <- function(v1,v2) {
    same <- (v1 == v2) | (is.na(v1) & is.na(v2))
    same[is.na(same)] <- FALSE
    return(same)
}

我喜欢这个,因为它非常简单,而且很容易看出它的作用。

答案 2 :(得分:2)

我们可以使用值v1动态替换NA值,这两个值都不存在于!=

f1 <- function(x, y) {
  v1 <- setdiff(1:1000, na.omit(unique(c(x,y))))[1]
  replace(x, is.na(x), v1) != replace(y, is.na(y), v1)
}

f1(a,b)
#[1] FALSE  TRUE  TRUE  TRUE FALSE
f1(a1,b1)
#[1] TRUE TRUE TRUE
f1(a2,b2)
#[1] FALSE  TRUE  TRUE FALSE

数据

a <- c(1, NA, 2, 2, NA)
b<-c(1, 1, 1, NA, NA)
a1 <- c(NA, 1, NA)
b1 <- c(2, NA, 3) 
a2<-c(1,NA,2,NA)
b2<-c(1,1,3,NA)