我有一个包含2个数字列的文件:value和count。文件可能具有> 5000行。我plot(value, count)
找到分布的形状。但由于数据点太多,图片不太清楚。
您知道更好的可视化方法吗?在x轴上分组接近值的直方图或条形图可能是查看数据的更好方法吗?我无法弄清楚使用直方图或条形图的语法。
答案 0 :(得分:1)
如果要将两个(连续)数量value
和count
相互关联,则需要执行散点图。问题在于,如果你有太多的观测值,那么这些点会重叠,并且该图最终会成为一个大的不透明质量,并带有一些零散的异常值。有几种方法可以解决这个问题:
使用较小的绘图符号:plot(value, count, pch=".")
使用透明度系数绘制数据点:plot(value, count, col=rgb(0, 0, 1, alpha=0.1))
答案 1 :(得分:0)
为什么不绘制数据的子集?例如,绘制与对应于第5,第10,......,第90,第95百分位数的值相关联的计数,例如,
value.subset <- quantile(value, seq(0, 1, 0.05))plot
然后根据各自的计数绘制分位数。