ete2如果节点是一对坐标,如何操作

时间:2014-03-02 21:02:59

标签: python python-2.7 tree treenode etetoolkit

我需要存储然后操作(添加新节点,搜索等)树,其中每个节点都是一对x,y坐标。我找到了ete2模块来处理树,但是我无法理解如何将节点保存为元组或坐标列表。是否可以使用ete2?

编辑:

我按照这里的教程http://pythonhosted.org/ete2/tutorial/tutorial_trees.html#trees 要创建一个简单的树:

t1 = Tree("(A:1,(B:1,(E:1,D:1):0.5):0.5);" )

其中A,B,C是节点的名称,数字是距离。

t2 = Tree( "(A,B,(C,D));" )

我不需要名字或距离,而是一个元组或列表树,如:

t3 = Tree("([12.01, 10.98], [15.65, 12.10],([21.32, 6.31], [14.53, 10.86]));")

但最后一个输入返回语法错误,在关于ete2的教程中我找不到任何类似的例子。作为一种变体,我认为我可以将坐标保存为属性,但将属性存储为字符串。我需要使用坐标进行操作,每次都要将它从字符串遍历到浮点数并且反之亦然。

1 个答案:

答案 0 :(得分:2)

您可以annotate ete trees使用任何类型的数据。只需为每个节点命名,使用这些名称创建树结构,并使用坐标注释树。

from ete2 import Tree

name2coord = {
'a': [1, 1], 
'b': [1, 1], 
'c': [1, 0], 
'd': [0, 1], 
}

# Use format 1 to read node names of all internal nodes from the newick string
t = Tree('((a:1.1, b:1.2)c:0.9, d:0.8);', format=1)     

for n in t.get_descendants():
   n.add_features(coord = name2coord[n.name])

# Now you can operate with the tree and node coordinates in a very easy way: 
for leaf in t.iter_leaves():
    print leaf.name, leaf.coord
# a [1, 1]
# b [1, 1]
# d [0, 1]

print t.search_nodes(coord=[1,0])
# [Tree node 'c' (0x2ea635)]

您可以使用pickle复制,保存和恢复带注释的树:

t.copy('cpickle')
# or
import cPickle
cPickle.dump(t, open('mytree.pkl', 'w'))
tree = cPickle.load(open('mytree.pkl'))