我有一个PDF文件夹,我应该在R中执行文本分析。到目前为止,最好的方法是使用R将这些文件转换为使用pdftotext的文本文件。然而,在此之后,我无法执行任何分析,因为文本文件被放置在与它们派生的PDF相同的文件夹中。
我通过以下方式实现这一目标:
dest <- "C:/PDF"
myfiles <- list.files(path = dest, pattern = "pdf", full.names = TRUE)
lapply(myfiles, function(i) system(paste('"C:/xpdfbin-win-3.04/bin64/pdftotext.exe"', paste0('"',i,'"')), wait= FALSE))
我想知道保留文本文件的最佳方法,无论是在此步骤中将它们保存到新创建的文件夹还是必须执行更多文件。
我试过了:
dir.create("C:/txtfiles")
new.folder <- "C:/txtfiles"
dest <- "C:/PDF"
list.of.files <-list.files(dest, ".txt$")
file.copy(list.of.files, new.folder)
然而,这只会填充新文件夹&#39; txtfiles&#39;使用以前几行代码创建的空白文本文件命名。
答案 0 :(得分:0)
使用以下代码:
files <- list.files(path="current folder location",pattern = "\\.txt$") #lists all .txt files
for(i in 1:length(files)){
file.copy(from=paste("~/current folder location/",files[i],sep=""),
to="destination folder")
这应该复制&#34;当前文件夹位置&#34;中的所有文本文件。到一个单独的文件夹&#34;目标文件夹&#34;。