通过包“tm”导入R中的pdf

时间:2013-07-01 23:28:30

标签: r pdf tm

我知道通过软件包“tm”在“R”工作区中获取pdf的实际示例,但无法理解代码是如何工作的,因此无法导入所需的pdf。在以下代码中导入的pdf是“tm”vignette。

代码是

if(file.exists(Sys.which("pdftotext"))) {
    pdf <- readPDF(PdftotextOptions = "-layout")(elem = list(uri = vignette("tm")$pdf),
                                                 language = "en",
                                                 id = "id1")
    pdf[1:13]
}

“tm”是小插曲。虽然我试图带来的pdf是“不同的”。那么如何更改上面的代码以将我的pdf带入工作区。 minn 是我要导入的pdf文档。

if(file.exists(Sys.which("pdftotext"))) {
        pdf <- readPDF(PdftotextOptions = "-layout")(elem = list(uri = vignette("minn")$pdf),
                                                     language = "en",
                                                     id = "id1")
        pdf[1:13]
    }

1 个答案:

答案 0 :(得分:1)

所以似乎问题出在我试图阅读的PDF上。但是代码如下所示。感谢托马斯的领导。 pdf的链接是&#34; http://www.wine-economics.org/workingpapers/AAWE_WP16.pdf&#34;

tt <- readPDF(PdftotextOptions="-layout")
rr <- tt(elem=list(uri="AAWE_WP16.pdf"),language="en",id="id1")
rr[1:15]