Question

基本上我想知道我是否可以生成热图，其中色标基于每列中的值范围。解决方案不一定需要进行任何聚类或生成树形图。

我有一个包含各种不同类型变量的数据框。有些是连续的，有些则是虚拟变量，或者是序数。我知道我需要将数据作为数字传递给任何群集函数，并且daisy（）函数是这里聚类的最佳选择。

我想生成一个热图，就像使用heatmap和heatmap.2生成的热图一样，但是缩放会导致可视化中出现问题。 This问题帮助我弄清楚如何让daisy（）与heatmap.2一起使用，但按列缩放意味着分配给虚拟变量的颜色因列而异。例如，对于具有虚拟变量的所有列，不是red = 1和white = 0，而是由于不同的平均值和标准偏差而产生的阴影。或者，如果我关闭缩放，整个数据集中的阴影几乎没有变化。似乎颜色范围基于整个数据框的范围，而不是每列。

当我有片刻时，我会尝试添加一些例子。

修改的

好的，这显然不清楚。

我发现的热图示例基于整个数据帧的最小值和最大值来缩放颜色。所以，给定一个像这样的数据框：

Row    Var 1  Var2
1      1      1
2     -5     10
3      0      7

我将蓝色设置为最低的单元格，白色表示中间值，红色表示最高单元格。结果将如下所示：

Row    Var 1  Var2
1      White  White
2      Blue   Red
3      Blue   Red

相反，我希望比例取决于每列中的值，结果如下所示：

Row    Var 1  Var2
1      White  Blue
2      Blue   Red
3      Red    White

热图，多种变量类型，R中的缩放

0 个答案: