我有一个关于在R中匹配两个矩阵以执行非常简单的计算的问题。我有工作代码(下面),但我觉得必须有一个更高效和'R-like'的方式来做到这一点。任何线索都非常受欢迎。
问题
我有两个相关信息的矩阵。 m1包含一堆引用。 m2包含那些引用的数据(零或一)。我想知道当你从m2中查找数据时,第一列中m1的哪些行为'0'而第二列中的哪一行为'1'。这是一个玩具示例:
> m1 <- matrix(data = c(51,52,53,51,54,55,56,57), nrow = 4, ncol = 2)
> m1
[,1] [,2]
[1,] 51 54
[2,] 52 55
[3,] 53 56
[4,] 51 57
> m2 <- matrix(data = c(0,0,1,0,0,1,1), nrow = 7, ncol = 1)
> rownames(m2) <- c(51,52,53,54,55,56,57)
> m2
[,1]
51 0
52 0
53 1
54 0
55 0
56 1
57 1
一般属性是我已经可以保证m1中的每个条目都有一个相应的行名称,并且我需要在更大的矩阵上进行数百万次,因此速度很有用。
我想要做的是使用m2来确定m1的哪一行在第一列中为零,在第二列中为1。在这种情况下,只有m1的最后一行具有该属性。
我的解决方案
我有一个相对O.K.对此的解决方案,它使用apply()并且不是太糟糕:
> is.zero.one <- function(line, m2){
+ start = m2[as.character(line[1]),]
+ end = m2[as.character(line[2]),]
+ if(start==0 && end==1){return(TRUE)}
+ else{return(FALSE)}
+}
> apply(m1, 1, is.zero.one, m2)
[1] FALSE FALSE FALSE TRUE
这很好用。但它感觉笨重。
我的问题
有谁知道更聪明/更快/更自然的方式吗?我查看了match()和相关函数,但无法提出解决方案。同样在这里搜索相关问题。我的问题的部分原因是我不是一个非常优秀的R程序员,所以即使这是一个不错的解决方案,我也很想知道其他人如何解决它。
感谢您的帮助。
答案 0 :(得分:7)
matrix( m2[ match(m1, rownames(m2) )], ncol=2)
[,1] [,2]
[1,] 0 0
[2,] 0 0
[3,] 1 1
[4,] 0 1
m3 <- matrix(m2[match(m1, rownames(m2) )], ncol=2)
which( m3[,1]==0 & m3[,2]==1 )
#[1] 4
m3[,1]==0 & m3[,2]==1
# [1] FALSE FALSE FALSE TRUE