如何使用python包ete2使用存储在列表中的字符串创建树?

时间:2015-12-27 17:49:55

标签: python tree etetoolkit

我正在尝试使用来自我的元胞自动机模型的合成数据输出的python包ete2来制作系统发育树。数据由列为(父,子)的对组成,其中对的每个成员是表示突变事件的唯一整数。我已将该对中的每个成员重新命名为字符串,并在其前面加上' r',现在:

(' r1',' r2')代表一个名为“r1'”的父母。产生了一个叫做“r2”的孩子。所以输出文件看起来像:

[['r1' 'r2']
 ['r1' 'r3']
 ['r1' 'r4']
 ['r1' 'r5']
 ['r1' 'r6']
 ['r1' 'r7']
 ['r1' 'r8']
 ['r1' 'r9']
 ['r2' 'r10']
 ['r1' 'r11']
 ['r1' 'r12']
 ['r8' 'r13']
 ['r1' 'r14']
 ['r4' 'r15']
 ['r1' 'r16']
 ['r1' 'r17']
 ['r1' 'r18']
 ['r1' 'r19']]

我想迭代列表以使用' add_child'但不断收到错误。我目前的代码是:

t = Tree() # Creates an empty tree
r1 = t.add_child(name="r1")

for row in range(0, len(pairs_list)):
    a = str(pairs_list[row,1])
    b = str(pairs_list[row,0])
    a = b.add_child(name = a)

我收到错误:

Traceback (most recent call last):
  File "treetest.py", line 33, in <module>
    a = b.add_child(name = a)
AttributeError: 'str' object has no attribute 'add_child'

如果我更换了&#39; b&#39;在我的代码的最后一行中使用r1(或其他东西)它可以找到,但当然这并不代表数据......在此先感谢,宇宙。

1 个答案:

答案 0 :(得分:3)

这样的事情:

t = Tree() # Creates an empty tree
r1 = t.add_child(name="r1")
lookup = {"r1": r1}

def sort_pairs(pair):
    # Extract integer after "r".
    return int(pair[0][1:])

for pair in sorted(pairs_list, key=sort_pairs):
    parentname = pair[0]
    childname = pair[1]
    if childname not in lookup:
        if parentname in lookup:
            # Add child.
            newchild = lookup[parentname].add_child(name = childname)
            lookup.add(childname, newchild)
        else:
            raise RuntimeError('Must not happen.')