在R中可视化数据重叠的最佳方式

时间:2013-12-18 06:42:54

标签: r grouping visualization data-visualization

如果我有一组对象,其中一些共享某些离散属性(例如A,B,C,D设置为1或0),我如何可视化数据集中这些属性的覆盖范围和重叠?

e.g。

        id  A  B  C  D
    1   34  1  0  0  1
    2   56  1  1  1  1
    3   14  0  0  1  1
    4   90  0  0  1  0

我主要使用R,并尝试了一些维恩图表包,但这在5个维度上并没有真正的可扩展性。

是否有另一个更适合此的可视化软件包?

1 个答案:

答案 0 :(得分:3)

我的建议可能不是您最初的可视化数据集的目的,但它可能是一种方法:考虑可视化任意两个观察(行)之间的成对距离。由于您有二进制数据,因此可以使用适合此数据类型的任何距离度量,例如,请参阅标题为“二进制相似性度量的度量”的文章。之后,您可以考虑基于计算出的距离度量进行聚类,以便您可以使用层次聚类结果中常用的热图和其他可视化工具。