如何获得两个矩阵的交叉?

时间:2015-08-10 14:11:02

标签: r matrix match

# These are the two matrices that I would like to subset based on identical
# entries within entire rows.
mata <- matrix(c("A", "B", "C", "F", "D", "E", "F", "G"), 
               nrow = 4, ncol = 2,
               dimnames = list(c(), c("A", "B")))
mata

##      A   B  
## [1,] "A" "D"
## [2,] "B" "E"
## [3,] "C" "F"
## [4,] "F" "G"

matb <- matrix(c("B", "A", "C", "F", "M", "D", "D", "H", "G", "X"), 
               nrow = 5, ncol = 2,
               dimnames = list(c(), c("A", "B")))
matb

##      A   B  
## [1,] "B" "D"
## [2,] "A" "D"
## [3,] "C" "H"
## [4,] "F" "G"
## [5,] "M" "X"

如果两个矩阵没有无序且长度相同,那么 以下代码应该有效并且效率很高。

mata[rowMeans(mata == matb) == 1, ]

我的一个hackish解决方案将是个人的连接 我想用于匹配的每个矩阵的列。在这 例如,我将使用所有列。

mata <- cbind(mata, C = paste0(mata[, "A"], "_", mata[, "B"]))
matb <- cbind(matb, C = paste0(matb[, "A"], "_", matb[, "B"]))
mata[mata[, "C"] %in% matb[, "C"], colnames(mata) != "C"]

##      A   B  
## [1,] "A" "D"
## [2,] "F" "G"

这是我正在寻找的结果,但我想知道是否 有更优雅的东西,例如矢量的%in%函数。

修改

该解决方案应适用于矩阵不适用的一般情况 必须长度相等。

2 个答案:

答案 0 :(得分:4)

您可以使用函数merge()

> merge(mata,matb)
  A B
1 A D
2 F G

答案 1 :(得分:4)

如果您加载dplyr,则会添加intersect.data.frame

library(dplyr)
options(stringsAsFactors=FALSE)
dfa <- as.data.frame(mata)
dfb <- as.data.frame(matb)
intersect(dfa,dfb)

#   A B
# 1 A D
# 2 F G

同样,unionsetequal(测试集等式)和setdiff(设置减号)可用。

除了。 data.frame的每一行对应一个观察,因此讨论交叉的两组观察(两个data.frames)是有意义的。然而,对于矩阵来说,它确实没有意义。这就是为什么如果你想继续使用矩阵的话,这个操作需要像OP的解决方案和@ RHertel(强制在幕后使用data.frame)这样的黑客攻击。