在子集100中划分大数据集,计算平均值和绘图

时间:2017-11-27 11:53:43

标签: r

我有一个庞大的数据集,其中包含数据 30000列。我想采取一行并绘制 100 (前100个条目,第二个100个条目,等等)的集合的方法,所以总共 300 条目。我已准备好用于绘图的脚本,但我无法弄清楚如何将我的数据划分为 100 的集合。

你们有人可以帮忙吗?谢谢

1 个答案:

答案 0 :(得分:0)

可能更容易融化数据,添加列标识符(1:300,每个重复100次),然后按该列进行汇总。

类似于:

library(dplyr)
df <- df %>%
   gather(Key, Value) %>%
   mutate(ID = rep(1:300, each = 100)) %>%
   group_by(Key, ID) %>%
   summarize(Mean = mean(Value))

ggplot(df) + 
   geom_point(aes(x = ID, y = Mean))

您必须自定义代码,因为我没有数据结构...