使用read_lines读取多页pdf

时间:2018-12-11 04:19:57

标签: r pdf readr

我正在使用pdftools将文本从pdf导入R中,并使用readr逐行读取它。它适用于第一页,但在此处停止。

阅读文档的所有页面似乎很简单,但是使用多个不同的文档却得到相同的结果。按照示例代码进行操作,我缺少步骤了吗?

install.packages("pdftools")
install.packages("readr")
library(pdftools)
library(readr)    

download.file("http://www.africau.edu/images/default/sample.pdf", 
"sample.pdf")
sample <- pdf_text("sample.pdf")
sample <- read_lines(sample)

print(sample)

添加可能与之有关,运行read_lines命令会显示警告:“运行read_lines命令会显示以下内容:

 "Warning message:
  In if (grepl("\n", file)) { :
  the condition has length > 1 and only the first element will be used""

1 个答案:

答案 0 :(得分:2)

通过卸载readr和pdftools,重新启动R并重新安装软件包来使其正常工作。