我有一个临床数据集,我想使用image()
函数对其进行绘制,以查看是否可以找出数据中的不同组。
此数据的结构为List of 2
:56个样本和5000个基因表达。
当我使用image(lung)
时,只看到一小块橙色,看不到图案或任何组对我引人注目。
数据集中基本上有四种类型的临床疾病:结肠癌(13个样本),小细胞(6个样本)等。
例如,与该数据集中的其他组/条件相比,我想看看带有6个样本的“ smallcell”具有自己的模式。
load(url("https://github.com/hughng92/dataset/raw/master/lung.RData"))
rownames(lung)
image(lung)
我想知道是否可以从数据集中组合这四个条件的四个不同图,
任何提示都很棒!
答案 0 :(得分:0)
我建议将类似类型重新排列后再查看图像输出。我想我现在在那些基因表达谱中看到了一些群体差异。具体来说,“正常”类别通常具有较少的红色条带,尽管有些夫妇的“正常”为红色,而其他不是。我认为有趣的是,与每种肿瘤类型相比,正常列(图像中)的变异性似乎要小,并且并不特别令人惊讶。我有一位朋友是分子生物学家,他将肿瘤描述为“遗传性火车残骸”:
table( rownames( lung[order(rownames(lung)), ]))
Carcinoid Colon Normal SmallCell
20 13 17 6
image( lung[order(rownames(lung)), ])
这将更好地说明类型分组的边界:
image( lung[order(rownames(lung)), ], xaxt="n")
axis(1, at=(cumsum( table( rownames( lung[order(rownames(lung)), ])))-1)/56 ,
labels=names(table( rownames( lung[order(rownames(lung)), ]))),las=2)