在保持系统发育位置的同时,通过尖端标签折叠进化枝

时间:2016-09-09 03:34:02

标签: r phylogeny ape-phylo

我可能更好地说明了标题,但是我想要在系统发育树中折叠任何分支(即使分支有一个成员),其标题为“foo”,然后计算提示的数量从特定的分支中删除并创建一个分支,标签显示35个foos。

计数部分很容易;但是,当我使用

drop.tip(rooted.tree,tip=which(rooted.tree$tip.label=='foo'),subtree=TRUE)

掉落的提示不会保持在树中的位置。相反,它们都在最后分组(但是正确计算)。反正是否有通过尖端标签折叠分支并保持其在树上的位置?

1 个答案:

答案 0 :(得分:1)

棘手的部分是确定你拥有多少个单独的单系分支。这个功能应该可以解决问题。

collapse_identical_tips <- function(phy,tip_label){
  matching_tips <- which(phy$tip.label==tip_label)
  nt <- length(phy$tip.label) # number of tips in tree
  nm <- length(matching_tips) # Number of tips matching the label
  keep <- numeric(nm)

  cur_tip <- 1
  while(cur_tip<=nm){
    if(cur_tip == nm){
      keep[cur_tip] <- 1
      break
    }
    next_tip <- cur_tip + 1
    mrca_ <- getMRCA(phy,c(matching_tips[cur_tip],matching_tips[next_tip]))
    descendants <- getDescendants(phy, mrca_)
    descendant_tips <- descendants[descendants<=nt]
    if(all(descendant_tips %in% matching_tips)){
      keep[cur_tip] <- 1
      cur_tip <- cur_tip + length(descendant_tips)
    }else{
      keep[cur_tip] <- 1
      cur_tip <- cur_tip + 1
    }
  }
  to_drop <- matching_tips[!keep]
  new_phy <- drop.tip(phy,to_drop)
  return(new_phy)
}

测试出来:

tc <- "(A:3.135206161,(B:2.757615245,(((C:0.5796267872,((foo:0.1917981792,(foo:0.08246947568,foo:0.08246947568):0.1093287035):0.2328473818,(D:0.3107268924,E:0.3107268924):0.1139186686):0.1549812262):0.3387382152,F:0.9183650024):1.172666972,(((G:0.02437174382,H:0.02437174382):0.4727952475,foo:0.4971669913):0.8701228492,(foo:1.124632261,(foo:0.6503599778,foo:0.6503599778):0.4742722831):0.2426575797):0.7237421344):0.6665832698):0.3775909166);"
phy <- read.tree(textConnection(tc))

plot(phy)

enter image description here

plot(collapse_identical_tips(phy,"foo"))

enter image description here