我使用R中的dplyr软件包制作图表,并且难以以pdf格式保存图表。
我有一组包含多组数据的数据框,我想绘制每组数据并将这些图保存为pdf。我尝试在dplyr包中使用do和group_by,但是没有生成pdf文件。没有错误消息。
rm(list = ls())
library(dplyr)
df=data.frame(x = c(rep('a',10),rep('b',10)),y = c(1:20))
plt = function(df)
{
pdf('plt1.pdf')
plot(df$x,df$y)
dev.off()
return(data.frame())
}
plt(df)
df %>% group_by(x) %>% do(data.frame(plot(.$y)))
我也尝试了lapply / sapply,类似的代码也没有用。
任何人都能帮助我吗?
答案 0 :(得分:2)
您需要调用plt
内的do
功能;如果要为每组数据生成单独的pdf文件,则必须根据数据组相应地修改文件名,否则文件将被最后一组数据中的图覆盖:
plt = function(df) {
pdf(sprintf('plt_%s.pdf', df$x[1]))
plot(df$x,df$y)
dev.off()
return(data.frame())
}
df %>% group_by(x) %>% do(plt(.))
此外,如果你只是希望有一个y分组的y的单个方框图,你可以使用一个boxplot
:
boxplot(y ~ x, data = df)
答案 1 :(得分:2)
以下是您的问题的解决方案:
rm(list = ls())
library(dplyr)
df=data.frame(x = c(rep('a',10),rep('b',10)),y = c(1:20))
plt = function(k, dtset) {
pdf(paste('plt',k,'.pdf',sep=""))
plot(dtset$y)
dev.off()
}
plt(1, df)
grps <- unique(df$x)
for (k in seq_along(grps)) {
plt(k, subset(df, df$x==grps[k]))
}
答案 2 :(得分:2)
如果您想将所有图表放在一个PDF中并且不介意使用ggplot
,则可以执行以下操作:
library(dplyr)
library(ggplot2)
library(gridExtra)
# i'm using a different test data set to make scatter plots
set.seed(1)
df <- data.frame(id = rep(c("a", "b"), each = 10),
var1 = rnorm(20),
var2 = rnorm(20),
stringsAsFactors = FALSE)
# make a list of plots, one for each group (id)
plotlist <- lapply(unique(df$id), function(x)
df %>%
filter(id == x) %>%
qplot(x = var1, y = var2, data = ., main = x)
)
# use marrangeGrob from gridExtra to get an arranged version of that list
mg = marrangeGrob(plotlist, nrow = 2, ncol = 1)
# now use ggsave to write a pdf with the plots arranged as specified in the
# previous step to the working directory; see documentation for ways to tinker
# with layout, file type, etc.
ggsave("myplots.pdf", mg)