假设我是一组2元素整数向量,例如该矩阵中的每一行:
my.mat = matrix(data = c(1,4,2,5,7,2,3,6,3,8), ncol = 2, byrow=T)
> my.mat
[,1] [,2]
[1,] 1 4
[2,] 2 5
[3,] 7 2
[4,] 3 6
[5,] 3 8
或者此列表:
my.list = list(c(1,4), c(2,5), c(7,2), c(3,6), c(3,8))
我正在寻找一个函数,它将这些向量相互交叉并返回list
,其中每个元素都是所有相交向量的值。不与任何其他向量相交的向量值也应作为列表元素返回。
简单来说,这应该返回此列表:
list(c(1,4), c(2,5,7,2), c(3,6,3,8))
如您所见,向量c(1,4)不与任何其他向量相交,因此它作为单个元素列表返回。另外两个列表元素是交叉点。
答案 0 :(得分:2)
我喜欢将igraph
软件包用于此类问题,因为很容易将行视为图中的边缘,并且您正在查找所有已连接的块。
my.mat = matrix(data = c(1,4,2,5,7,2,3,6,3,8), ncol = 2, byrow=T)
library(igraph)
class(my.mat)<-"character"
gg <- graph.edgelist(my.mat, directed=T)
vset <- clusters(gg)$membership
xx<-sapply(unique(vset), function(s) {
es <- E(gg)[from(V(gg)[vset==s])]
as.numeric(V(gg)[t(get.edges(gg,es))]$name)
})
这会将您的矩阵转换为边缘列表(如果您有非连续数字,则实际上只需要转换为字符,因此它更常用)。这就是图表
然后clusters()
函数将它们分成子组。然后我遍历每个子组并提取每个子组边缘的顶点名称。
最后,xx
的值将为
[[1]]
[1] 1 4
[[2]]
[1] 2 5 7 2
[[3]]
[1] 3 6 3 8
所以它是一个连接值列表。