Question

我正在研究生物数据 - 即基因组。例如：

group 1: geneA geneB geneC
group 2: geneD geneE
group 3: geneF geneG geneH

对于每对基因，geneX和geneY我都有一个分数，告诉我们这两个基因是多么相似（实际上，我有两个分数，因为我使用BLAST这是'定向'：我首先搜索geneX对所有其他基因然后geneY对所有其他基因，所以我有两个geneX--geneY得分，但我想我可以取两者的较低分数，或者平均值）。

所以，我们假设每对基因只有一个分数。我的数据可以被视为无向图： alt text

并回想起每条边都有一个分数。

现在，我想做的是：

以交互方式可视化我的数据：能够点击基因节点并打开附加到它们的链接，仅显示高于/低于某个阈值的边缘，控制网络如何“传播”等。
将群组聚集在一起是相似的，即具有的群体相似的基因。

我怎么能这样做的想法？我想这是基本的集群，我很感激任何有关软件包/软件的提示，可以提供任何帮助。

谢谢。

Answer 1

如果您在生物信息学堆栈交换BioStar处提出此问题，您可能会得到更好的回复。具体而言，此主题中的许多答案可能都是相关的：

Which is the best software to represent biological pathways in a directed graph (network) ?

Answer 2

您可以尝试cluto。你必须将你的三元组（gene_1，gene_2，相似性）转换成矩阵并使用'scluster'。

如何可视化基因网络和群集基因？

2 个答案: