来自库tm的readPDF函数不适用于R 3.5.0中的xpdf

时间:2018-07-03 17:45:20

标签: r tm pdf-scraping xpdf

我正在使用tm库和readPDF将pdf文件作为文本导入R。当我在3.4.4之前的版本中使用R时,下面的代码可以正常工作。

  library(tm)
  Rpdf <- readPDF(engine = "xpdf", control = list(text = "-table -nodiag"))
  docs <- Corpus(URISource(path), # path = the complete path of a pdf file
                 readerControl = list(reader = Rpdf))

当我更新到R 3.5.0时,我不能再运行相同的代码。我收到这样的错误:

  

file(con,“ r”)中的错误:无法打开连接此外:   警告消息:在文件(con,“ r”)中:无法打开文件   'C:\ Users \ FERNAN〜1 \ AppData \ Local \ Temp \ RtmpSSba0K \ pdfinfo7a986716341d':   没有这样的文件或目录

有人知道如何解决此问题吗?

0 个答案:

没有答案