我在目录中有大约一百个长PDF文件,想知道R是否可以计算每个文件中有多少页面。我的操作系统是Windows 8。
这是指向10页PDF文件的链接,以防这有助于您测试解决方案。 MWE pdf file
似乎可以使用python计算PDF页面,但我不知道该语言python solution。已经使用例如Imagemagick在SO上讨论了其他解决方案。和C ##。
答案 0 :(得分:0)
我正在使用Windows 7计算机,但我在Windows 8上的体验让我觉得它应该对你有用。
我无法编译...
double x[12];
void AddPayment(double Amount)
{
int i = sizeof(x);
x[i] = Amount;
}
包,正如hrbrmstr指出的那样,它可能不值得战斗。如果你有7-Zip,你可以提取Windows的poppler工具。我已将它们提取到Rpoppler
位置。在那里,我可以做以下
C:\poppler
如果你想传递一个文件名矢量
file_name <- "C:/[file_path]/whitepaper-pdfprimer.pdf"
pdf_pages <- function(file_name){
require(magrittr)
pages <- system2("C:/poppler/bin/pdfinfo.exe",
args = file_name,
stdout = TRUE)
pages[grepl("Pages:", pages)] %>%
gsub("Pages:", "", .) %>%
as.numeric()
}
pdf_pages(file_name)
归功于@hrbrmstr指出poppler工具(我直到今天才听说过它们)。
答案 1 :(得分:0)
On R version 3.3.2 pdftools
有效:
library(pdftools)
pdfInfo <- pdf_info(<path to PDF file>)
pdfInfo$pages