我正在研究生物数据 - 即基因组。例如:
group 1: geneA geneB geneC
group 2: geneD geneE
group 3: geneF geneG geneH
对于每对基因,geneX
和geneY
我都有一个分数,告诉我们这两个基因是多么相似(实际上,我有两个分数,因为我使用BLAST这是'定向':我首先搜索geneX
对所有其他基因然后geneY
对所有其他基因,所以我有两个geneX--geneY
得分,但我想我可以取两者的较低分数,或者平均值)。
所以,我们假设每对基因只有一个分数。我的数据可以被视为无向图:
并回想起每条边都有一个分数。
现在,我想做的是:
以交互方式可视化我的数据:能够点击基因节点 并打开附加到它们的链接,仅显示高于/低于某个阈值的边缘,控制网络如何“传播”等。
将群组聚集在一起 是相似的,即具有的群体 相似的基因。
我怎么能这样做的想法?我想这是基本的集群,我很感激任何有关软件包/软件的提示,可以提供任何帮助。
谢谢。
答案 0 :(得分:1)
如果您在生物信息学堆栈交换BioStar处提出此问题,您可能会得到更好的回复。 具体而言,此主题中的许多答案可能都是相关的:
Which is the best software to represent biological pathways in a directed graph (network) ?
答案 1 :(得分:0)
您可以尝试cluto。你必须将你的三元组(gene_1,gene_2,相似性)转换成矩阵并使用'scluster'。