聚类策略给出了已知的治疗方法

时间:2016-01-17 04:16:48

标签: r classification cluster-analysis data-analysis pheatmap

是否有策略在一个条件中聚集组内的共享属性,知道条件应该激发两个组之间的差异?

一个具体的例子:说A组中有4个人,B组中有4个人.A组被引入StackOverflow,其他人只剩下他们的铁意志了。每个个体检查30 000个基因。我们期望与B组相比,A组个体应该相对无压力。因此,我们寻找可能在B组中高表达但在A组中低表达的基因簇。鉴定这组基因是有用的,因为这些基因可以解释对压力的生物反应。

但事实证明这两组不是线性可分的 - PCA在A组和B组中表现出很大的差异.A组中的一些个体聚集在B组中。有些基因在组中被上调B,但A组中的一个或两个人也承担了这种上调。是否存在一种策略来查找A组中所有个体统一共享的属性,并且该组与B组中的所有个体不同,知道这两个组应该是不同。

1 个答案:

答案 0 :(得分:2)

这不是聚类分析。

您有两个:治疗和控制

并且您想要识别那些有助于区分这两个类别的特征(基因)。

寻找有监督的特征选择方法,例如信息增益;并研究可解释的分类器,如决策树和随机森林,它们将帮助您识别最具辨别力的基因。