在python中保存来自层次聚类的数据的位置?

时间:2015-09-04 11:38:21

标签: python dictionary

我正在分层聚类基因表达数据。我的结果数据形状像树状图。我希望将整个树保存在python中的某些数据结构中,并在每个节点中进行一些计算(我认为是递归的)。对于每个节点,我都知道那里的基因和一些额外的信息(GO,p值等......) 你对如何在python中存储这种数据有任何建议,我可以遍历整个树吗? 我的第一个想法是词典列表:

clusters=[{'id': 1, 'cluster': [gen1, gen2,...], 'size': ... , 'ChildIDs': ... , 'ParentID': ... , 'distance': ..., 'score': ...}, {'id': 2, ...}, ... ]

但是,由于群集是嵌套的,因此我认为为每个群集存储基因效率不高。

如果有人知道如何保留这种信息,我将不胜感激:)

1 个答案:

答案 0 :(得分:0)

如果没有编写自己的数据结构,collections.defaultdict可能适合树。请参阅here