循环遍历PDF以创建数据框

时间:2019-03-06 21:02:32

标签: r loops pdf

我正在尝试遍历多个PDF,并使用rbind将其合并。现在我有这个:

for (i in 1:length(all_pdfs)) {
   docket <- pdftools::pdf_text(all_pdfs[[i]]) %>%
     as.tibble() %>%
     mutate(month = as.character(d$docket_month[[i]]))
  }

其中all_pdfs是PDF的列表。但是,docket只返回第一个PDF作为数据框。我究竟做错了什么?提前致谢。

1 个答案:

答案 0 :(得分:0)

您可以尝试将摘要创建到列表中,然后取消列出列表。

docket <- list()
for (i in 1:length(all_pdfs)) {
          docket[[i]] <- pdftools::pdf_text(all_pdfs[[i]]) %>%
          as.tibble() %>%
          mutate(month = as.character(d$docket_month[[i]]))
       }

docket <- unlist(docket)