我有一棵大树,我希望为每个叶节点获取路径(所有节点)直到根。
我试图用ete2做这个,但树很大,而且看起来太慢了。
有人能建议更快的方法吗?
这就是我正在做的事情:
tr = Tree("anytree.nw", format=8)
path_leaf_root = {} ## all paths from leafs to root
root = tr.get_tree_root()
for le in tr:
if not path_leaf_root.has_key(le.name):
path_leaf_root[le.name]=[]
le_up = le
while not le_up.name == root.name:
le_up=le.up
path_leaf_root[le.name].append(le_up.name)
答案 0 :(得分:1)
您可以尝试以下方法,该方法仅遍历树一次。在我的计算机中,它以0.24秒的速度处理了一个50k的提示树(如果打印或写入结果,则会更长一点):
from ete2 import Tree
t = Tree()
t.populate(50000)
import time
t1 = time.time()
current_path = [t]
for postorder, node in t.iter_prepostorder():
if postorder:
current_path.pop(-1)
else:
if not node.children:
# print node.name, "path :", current_path
pass
else:
current_path.append(node)
print time.time() - t1
# 0.242053985596