R绘制data.frame以获得更有效的数据概览

时间:2016-12-29 14:06:42

标签: r plot visualization

在我想要了解数据集的工作中(我使用人寿保险中的投资组合数据),我通常会在Excel中使用数据透视表来查看数据集。变量随时间的变化或变量之间的依赖关系的发展。 我记得大学里有一个漂亮的R函数,你可以在其中绘制数据帧的每一列,而不是像其他列一样:

enter image description here

对于issue.age和持续时间之间的依赖关系,这个情节实际上很有趣,因为你可以清楚地看到高发行年龄的政策持续时间较短(因为每个政策的最大年龄)。然而,涉及问题年iss.year的情节远不如“视觉”。事实上,你无法从中看到任何东西。我想一眼就能看出问题年龄的分布在不同的问题上是否发生了变化。年,如

enter image description here

您可以立即看到新发布政策的平均年龄从2014年到2016年一直在增加。

我不想编写需要为我放入的每个数据集定制的代码,因为我也可以在Excel中手动更快地完成。

所以我的问题是,是否有一种简单的方法可以使用比标准plot(data.frame)更灵活的图表类型来绘制矩阵的每列与每个其他列的对比?

1 个答案:

答案 0 :(得分:4)

GGally library中的ggpairs()功能。它具有很多可视化所有不同类型列的功能,并提供了对可视化内容的大量控制。

例如,以下是与上面链接的小插图的片段:

data(tips, package = "reshape")
ggpairs(tips)

ggpair example visualization