如何在Perl中基于存在缺失二进制矩阵数据实现聚类?

时间:2014-11-17 10:29:30

标签: perl matrix hierarchical-clustering dendrogram phylogeny

Position   Isolate 1   Isolate 2   Isolate 3 ... Isolate n

1              1               0              0           ... 0

2              0               0              1           ... 1

3              1               1              0           ... 0

.
.
upto 20000 rows

1s和0s随机出现。 (基本上是在场缺席数据)
我想将这个nX20000二进制矩阵转换为nXn距离矩阵 我想知道这背后的数学步骤 (我想在perl中以编程方式完成此任务。)

修改
 现在,我有距离矩阵。我需要方法(perl)从距离矩阵创建海法聚类和树状图。

这是:

Position           Isolate 1    Isolate 2   Isolate 3 ... Isolate n

Isolate 1              -             -          -           -

Isolate 2              0.3           -          -           -

Isolate 3              0.5          0.8         -           -
.
Isolate n              0.6          0.7        0.6          -

任何模块已经这样做了吗?如果我需要从头开始怎么办?

0 个答案:

没有答案