我们希望使用分层或k均值聚类,根据其功能将基因聚类在我们的数据集中。我们获得了每个基因的GO id,现在我们希望根据功能优先分层将它们分组。这意味着从底部(每个函数都是唯一的)到上层(我们有更多的通用/函数组)。我们正在编写R。
提前感谢您的帮助!
答案 0 :(得分:1)
用户可以在两种情况之间进行差异表达分析,或者根据条件或时间点的表达来聚类基因。之后,可以在差异表达的基因组或聚类中寻找过多的GO术语。
您可能对GeneMania(http://www.genemania.org/)感兴趣 - 您可以输入将在网络中呈现的基因列表(有很多选项可用于定制和扩展)。此工具将再次为您提供在网络中丰富的GO术语。第二个感兴趣的工具是Gorilla(http://cbl-gorilla.cs.technion.ac.il/) - 这将显示GO层次结构本身,如果它们被丰富,GO术语会亮起。
答案 1 :(得分:1)
k-means对于这类数据不是一个好主意。
相反,请查看此数据的专用算法,尤其是双聚类算法。