如果给出一组100万条数据记录,我该如何计算直方图?如果有人可以告诉我如何处理这个问题并且我将弄清楚如何实现代码,那将非常有帮助。我想在不使用任何内置直方图的软件包的情况下执行此操作
答案 0 :(得分:2)
我同意@shea这是一个不寻常的要求,但我会咬人。第一步是创建一些虚拟数据......
library(tidyverse)
dta <- tibble(value = rnorm(1000000))
直方图只是一个条形图,显示有多少数据点落入一堆箱中。因此,让我们将这些二进制文件创建为一个新变量bin
。此代码还会计算每个bin中有多少值,并调用变量n
。
dta <- dta %>%
mutate(bin = cut(value, breaks = 20)) %>%
group_by(bin) %>%
summarise(n = n())
由于bin
是一个有序因子,您可以使用X轴上的bin和Y上的n创建一个条形图。您要求不显示如何执行该部分,因此我将停止这里: - )