我使用GGPlot2绘制大型数据集(170k行)的经验分布函数。不幸的是,线型不清晰(由于过度绘图?)。
有什么想法吗?
test = data.frame(
a = c(rnorm(75000)*100,rnorm(75000)*100+50),
b = c(rep('a', 75000),rep('b', 75000))
)
ggplot(test, aes(a, linetype = factor(b))) +
stat_ecdf()
答案 0 :(得分:1)
这是因为"步骤"远远超过线型中的差距。
您可以尝试使用+ stat_ecdf(n = 500)
启用插值来查看差异。当您没有设置n
参数时,它会使用所有数据,而在您的特定情况下,只有这么多" step"指出没有足够的像素来显示线型。