使用R,有人如何计算PDF文件中的页数?

时间:2015-10-20 11:08:04

标签: r pdf count

我在目录中有大约一百个长PDF文件,想知道R是否可以计算每个文件中有多少页面。我的操作系统是Windows 8。

这是指向10页PDF文件的链接,以防这有助于您测试解决方案。 MWE pdf file

似乎可以使用python计算PDF页面,但我不知道该语言python solution。已经使用例如Imagemagick在SO上讨论了其他解决方案。和C ##。

2 个答案:

答案 0 :(得分:0)

我正在使用Windows 7计算机,但我在Windows 8上的体验让我觉得它应该对你有用。

我无法编译... double x[12]; void AddPayment(double Amount) { int i = sizeof(x); x[i] = Amount; } 包,正如hrbrmstr指出的那样,它可能不值得战斗。如果你有7-Zip,你可以提取Windows的poppler工具。我已将它们提取到Rpoppler位置。在那里,我可以做以下

C:\poppler

如果你想传递一个文件名矢量

file_name <- "C:/[file_path]/whitepaper-pdfprimer.pdf"

pdf_pages <- function(file_name){
  require(magrittr)
  pages <- system2("C:/poppler/bin/pdfinfo.exe",
                   args = file_name,
                   stdout = TRUE)
  pages[grepl("Pages:", pages)] %>%
    gsub("Pages:", "", .) %>%
    as.numeric()
}

pdf_pages(file_name)

归功于@hrbrmstr指出poppler工具(我直到今天才听说过它们)。

答案 1 :(得分:0)

On R version 3.3.2 pdftools有效:

library(pdftools)
pdfInfo <- pdf_info(<path to PDF file>)
pdfInfo$pages