我知道通过软件包“tm”在“R”工作区中获取pdf的实际示例,但无法理解代码是如何工作的,因此无法导入所需的pdf。在以下代码中导入的pdf是“tm”vignette。
代码是
if(file.exists(Sys.which("pdftotext"))) {
pdf <- readPDF(PdftotextOptions = "-layout")(elem = list(uri = vignette("tm")$pdf),
language = "en",
id = "id1")
pdf[1:13]
}
“tm”是小插曲。虽然我试图带来的pdf是“不同的”。那么如何更改上面的代码以将我的pdf带入工作区。 minn 是我要导入的pdf文档。
像
if(file.exists(Sys.which("pdftotext"))) {
pdf <- readPDF(PdftotextOptions = "-layout")(elem = list(uri = vignette("minn")$pdf),
language = "en",
id = "id1")
pdf[1:13]
}
答案 0 :(得分:1)
所以似乎问题出在我试图阅读的PDF上。但是代码如下所示。感谢托马斯的领导。 pdf的链接是&#34; http://www.wine-economics.org/workingpapers/AAWE_WP16.pdf&#34;
tt <- readPDF(PdftotextOptions="-layout")
rr <- tt(elem=list(uri="AAWE_WP16.pdf"),language="en",id="id1")
rr[1:15]