如果我有一组对象,其中一些共享某些离散属性(例如A,B,C,D设置为1或0),我如何可视化数据集中这些属性的覆盖范围和重叠?
e.g。
id A B C D
1 34 1 0 0 1
2 56 1 1 1 1
3 14 0 0 1 1
4 90 0 0 1 0
我主要使用R,并尝试了一些维恩图表包,但这在5个维度上并没有真正的可扩展性。
是否有另一个更适合此的可视化软件包?
答案 0 :(得分:3)
我的建议可能不是您最初的可视化数据集的目的,但它可能是一种方法:考虑可视化任意两个观察(行)之间的成对距离。由于您有二进制数据,因此可以使用适合此数据类型的任何距离度量,例如,请参阅标题为“二进制相似性度量的度量”的文章。之后,您可以考虑基于计算出的距离度量进行聚类,以便您可以使用层次聚类结果中常用的热图和其他可视化工具。