系统发育树 - 如何通过物种矩阵创建分支?

时间:2015-11-09 21:41:44

标签: r phylogeny

使用R中的系统发育树,我想创建一个矩阵,指示树的每个分支(B1到B8)是否与每个物种(A到E)相关联,其中1表示分支是相关的。 (如下所示)

R函数which.edge()可用于识别物种的末端分支。但它并不能识别与每个物种相关的所有分支。我可以使用什么函数来识别树中从每个物种的根到尖端的所有分支?

示例树

library(ape)
ex.tree <- read.tree(text="(A:4,((B:1,C:1):2,(D:2,E:2):1):1);") 
plot(ex.tree)
edgelabels() #shows branches 1-8

这是我想要创建的矩阵(物种A-E作为列,分支B1-B8作为行),但是具有简单的功能而不是手动。

B1 <- c(1,0,0,0,0)
B2 <- c(0,1,1,1,1)
B3 <- c(0,1,1,0,0)
B4 <- c(0,1,0,0,0)
B5 <- c(0,0,1,0,0)
B6 <- c(0,0,0,1,1)
B7 <- c(0,0,0,1,0)
B8 <- c(0,0,0,0,1)
Mat <- rbind(B1,B2,B3,B4,B5,B6,B7,B8)   
colnames(Mat) <- c("A","B","C","D","E")
Mat

例如,分支B2到物种B-E,但不到物种A.对于物种E,分支B2,B6,B8存在。

哪种R功能最好?提前谢谢!

1 个答案:

答案 0 :(得分:2)

我不知道有任何内置函数可以做到这一点。我写了一个辅助函数,可以从存储在tree对象中的边数据计算出来。

branchNodeAdjacency <- function(x) {
    m <- matrix(0, ncol=nt, nrow=nrow(x$edge))
    from <- x$edge[,1]
    to <- x$edge[,2]
    g <- seq_along(x$tip.label)
    while (any(!is.na(g))) {
        i <- match(g, to)
        m[cbind(i, seq_along(i))] <- 1
        g <- from[i]
    }
    rownames(m) <- paste0("B", seq.int(nrow(m)))
    colnames(m) <- x$tip.label
    m
}

branchNodeAdjacency(ex.tree)
#    A B C D E
# B1 1 0 0 0 0
# B2 0 1 1 1 1
# B3 0 1 1 0 0
# B4 0 1 0 0 0
# B5 0 0 1 0 0
# B6 0 0 0 1 1
# B7 0 0 0 1 0
# B8 0 0 0 0 1

我们的想法是跟踪每个内部节点表示哪些叶节点值。