如何使用数千个数据点可视化(值,计数)数据集

时间:2011-03-09 19:18:26

标签: r

我有一个包含2个数字列的文件:value和count。文件可能具有> 5000行。我plot(value, count)找到分布的形状。但由于数据点太多,图片不太清楚。

您知道更好的可视化方法吗?在x轴上分组接近值的直方图或条形图可能是查看数据的更好方法吗?我无法弄清楚使用直方图或条形图的语法。

2 个答案:

答案 0 :(得分:1)

如果要将两个(连续)数量valuecount相互关联,则需要执行散点图。问题在于,如果你有太多的观测值,那么这些点会重叠,并且该图最终会成为一个大的不透明质量,并带有一些零散的异常值。有几种方法可以解决这个问题:

  • 使用较小的绘图符号:plot(value, count, pch=".")

  • 使用透明度系数绘制数据点:plot(value, count, col=rgb(0, 0, 1, alpha=0.1))

答案 1 :(得分:0)

为什么不绘制数据的子集?例如,绘制与对应于第5,第10,......,第90,第95百分位数的值相关联的计数,例如,

value.subset <- quantile(value, seq(0, 1, 0.05))plot

然后根据各自的计数绘制分位数。