使用dplyr包生成打印文件失败

时间:2017-04-23 17:56:27

标签: r plot dplyr apply lapply

我使用R中的dplyr软件包制作图表,并且难以以pdf格式保存图表。

我有一组包含多组数据的数据框,我想绘制每组数据并将这些图保存为pdf。我尝试在dplyr包中使用do和group_by,但是没有生成pdf文件。没有错误消息。

rm(list = ls())

library(dplyr)

df=data.frame(x = c(rep('a',10),rep('b',10)),y = c(1:20))

plt = function(df)
{
  pdf('plt1.pdf')

  plot(df$x,df$y)

  dev.off()

  return(data.frame())
}

plt(df)

df %>% group_by(x) %>% do(data.frame(plot(.$y)))

我也尝试了lapply / sapply,类似的代码也没有用。

任何人都能帮助我吗?

3 个答案:

答案 0 :(得分:2)

您需要调用plt内的do功能;如果要为每组数据生成单独的pdf文件,则必须根据数据组相应地修改文件名,否则文件将被最后一组数据中的图覆盖:

plt = function(df) {
    pdf(sprintf('plt_%s.pdf', df$x[1]))
    plot(df$x,df$y)
    dev.off()
    return(data.frame())
}

df %>% group_by(x) %>% do(plt(.))

此外,如果你只是希望有一个y分组的y的单个方框图,你可以使用一个boxplot

boxplot(y ~ x, data = df)

答案 1 :(得分:2)

以下是您的问题的解决方案:

rm(list = ls())
library(dplyr)
df=data.frame(x = c(rep('a',10),rep('b',10)),y = c(1:20))

plt = function(k, dtset) {
 pdf(paste('plt',k,'.pdf',sep=""))
 plot(dtset$y)
 dev.off()
}
plt(1, df)

grps <- unique(df$x)
for (k in seq_along(grps)) {
 plt(k, subset(df, df$x==grps[k]))
}

答案 2 :(得分:2)

如果您想将所有图表放在一个PDF中并且不介意使用ggplot,则可以执行以下操作:

library(dplyr)
library(ggplot2)
library(gridExtra)

# i'm using a different test data set to make scatter plots
set.seed(1)
df <- data.frame(id = rep(c("a", "b"), each = 10),
                 var1 = rnorm(20),
                 var2 = rnorm(20),
                 stringsAsFactors = FALSE)

# make a list of plots, one for each group (id)
plotlist <- lapply(unique(df$id), function(x)

  df %>%
    filter(id == x) %>%
    qplot(x = var1, y = var2, data = ., main = x)

)

# use marrangeGrob from gridExtra to get an arranged version of that list
mg = marrangeGrob(plotlist, nrow = 2, ncol = 1)

# now use ggsave to write a pdf with the plots arranged as specified in the
# previous step to the working directory; see documentation for ways to tinker
# with layout, file type, etc.
ggsave("myplots.pdf", mg)