可视化R中的大数据xy回归图(可能是轮廓直方图?)

时间:2015-09-03 18:02:22

标签: r contour

我有100万个x-y数据点。其中100,000人来自foo;其中900,000人来自酒吧。也许还有一些不寻常的质量点。让我帮助我的观众想象他们,而不仅仅是回归或黄土线,而是数据。让我用红色绘制条形图,用蓝色绘制foos,然后在它们上面绘制我的两条黄土线条。想想像

这样的东西
K <- 1000 ; M <- K*K ; HT <- 100*K
x <- rnorm(M); y <- x+rnorm(M); y[1:HT] <- y[1:HT]+1 ; x[HT:(HT*2)] <- y[HT:(HT*2)] <- 0
pdf(file="try.pdf")
plot( x, y, col="blue", pch=".")
points( x[1:HT], y[1:HT], col="red", pch="." )
## scatter.smooth( x[1:HT], y[1:HT] ), but this seems to take forever
dev.off()

这不仅一个很好的视觉效果(例如,高高的零点丢失),而且还会创建一个7.5MB(!)的pdf文件。我的预告员也几乎呛到它。 (提示:jpeg压缩对于这个问题非常有用。也就是说,而不是pdf(),只需使用jpeg和不同的文件扩展名。缺点:轴也会被模糊压缩。)

所以,我需要一些更好的想法。我正在考虑在完整数据集上的二维fill.contourplot(灰度到达不太远的黑色),具有1:HT点的简单轮廓覆盖,然后是两个黄土覆盖。唉,即使要做到这一点,我需要开始平滑出现在xy位置的数据点的数量,并且可能是binning-first不是最好的方法 - 它会丢弃信息,这就是轮廓情节可以使用。

或者,我可以使用标准的xy图,并简单地剔除随机点,直到文件足够小并且视觉效果足够好。这也许可以通过合并来实现。

更好的想法?

0 个答案:

没有答案