基本上我想知道我是否可以生成热图,其中色标基于每列中的值范围。解决方案不一定需要进行任何聚类或生成树形图。
我有一个包含各种不同类型变量的数据框。有些是连续的,有些则是虚拟变量,或者是序数。我知道我需要将数据作为数字传递给任何群集函数,并且daisy()函数是这里聚类的最佳选择。
我想生成一个热图,就像使用heatmap和heatmap.2生成的热图一样,但是缩放会导致可视化中出现问题。 This问题帮助我弄清楚如何让daisy()与heatmap.2一起使用,但按列缩放意味着分配给虚拟变量的颜色因列而异。例如,对于具有虚拟变量的所有列,不是red = 1和white = 0,而是由于不同的平均值和标准偏差而产生的阴影。或者,如果我关闭缩放,整个数据集中的阴影几乎没有变化。似乎颜色范围基于整个数据框的范围,而不是每列。
当我有片刻时,我会尝试添加一些例子。
修改的
好的,这显然不清楚。
我发现的热图示例基于整个数据帧的最小值和最大值来缩放颜色。所以,给定一个像这样的数据框:
Row Var 1 Var2
1 1 1
2 -5 10
3 0 7
我将蓝色设置为最低的单元格,白色表示中间值,红色表示最高单元格。结果将如下所示:
Row Var 1 Var2
1 White White
2 Blue Red
3 Blue Red
相反,我希望比例取决于每列中的值,结果如下所示:
Row Var 1 Var2
1 White Blue
2 Blue Red
3 Red White