使用ete2保存从叶到根的路径

时间:2014-10-14 15:25:29

标签: python etetoolkit

我有一棵大树,我希望为每个叶节点获取路径(所有节点)直到根。

我试图用ete2做这个,但树很大,而且看起来太慢了。

有人能建议更快的方法吗?

这就是我正在做的事情:

    tr = Tree("anytree.nw", format=8)
    path_leaf_root = {} ## all paths from leafs to root
    root = tr.get_tree_root()
    for le in tr:
        if not path_leaf_root.has_key(le.name):
            path_leaf_root[le.name]=[]
        le_up = le
        while not le_up.name == root.name:
            le_up=le.up
            path_leaf_root[le.name].append(le_up.name)

1 个答案:

答案 0 :(得分:1)

您可以尝试以下方法,该方法仅遍历树一次。在我的计算机中,它以0.24秒的速度处理了一个50k的提示树(如果打印或写入结果,则会更长一点):

from ete2 import Tree
t = Tree()
t.populate(50000)

import time
t1 = time.time()
current_path = [t]
for postorder, node in t.iter_prepostorder():
    if postorder:
        current_path.pop(-1)
    else:
        if not node.children:
            # print node.name, "path :", current_path
            pass
        else:
            current_path.append(node)
print time.time() - t1

# 0.242053985596