热图,多种变量类型,R中的缩放

时间:2014-09-23 21:01:28

标签: r cluster-analysis normalization gplots

基本上我想知道我是否可以生成热图,其中色标基于每列中的值范围。解决方案不一定需要进行任何聚类或生成树形图。

我有一个包含各种不同类型变量的数据框。有些是连续的,有些则是虚拟变量,或者是序数。我知道我需要将数据作为数字传递给任何群集函数,并且daisy()函数是这里聚类的最佳选择。

我想生成一个热图,就像使用heatmap和heatmap.2生成的热图一样,但是缩放会导致可视化中出现问题。 This问题帮助我弄清楚如何让daisy()与heatmap.2一起使用,但按列缩放意味着分配给虚拟变量的颜色因列而异。例如,对于具有虚拟变量的所有列,不是red = 1和white = 0,而是由于不同的平均值和标准偏差而产生的阴影。或者,如果我关闭缩放,整个数据集中的阴影几乎没有变化。似乎颜色范围基于整个数据框的范围,而不是每列。

当我有片刻时,我会尝试添加一些例子。

修改

好的,这显然不清楚。

我发现的热图示例基于整个数据帧的最小值和最大值来缩放颜色。所以,给定一个像这样的数据框:

Row    Var 1  Var2
1      1      1
2     -5     10
3      0      7

我将蓝色设置为最低的单元格,白色表示中间值,红色表示最高单元格。结果将如下所示:

Row    Var 1  Var2
1      White  White
2      Blue   Red
3      Blue   Red

相反,我希望比例取决于每列中的值,结果如下所示:

Row    Var 1  Var2
1      White  Blue
2      Blue   Red
3      Red    White

0 个答案:

没有答案