我正在做一些网络抓取工作,每天返回一些目录(路径)中的pdf文件,我需要找到某种方式以简单的方式获取所有文件。现在,我将一一列出所有文件。有简单的方法吗?
data_download
pdf_01 <- paste("path\\", data_download, " - MK - Debêntures novas.pdf", sep="")
pdf_02 <- paste("path\\", data_download, " - MK - Fundos novos.pdf", sep="")
pdf_03 <- paste("path\\", data_download, " - News - Instruções CVM.pdf", sep="")
pdf_04 <- paste("path\\", data_download, " - News - Notícias CVM.pdf", sep="")
pdf_merged <- paste("path\\", data_download, " - Novidades de hoje.pdf", sep="")
pdf_combine(c(pdf_01,pdf_02,pdf_03,pdf_04) ,output = pdf_merged)
答案 0 :(得分:1)
函数list.files()
将使您获得所需的大部分信息,如果要合并路径文件夹中名称中包含“ pdf”的所有文件,则可以执行以下操作:< / p>
pdf_combine(list.files(path, pattern="pdf", full.names=TRUE), output = pdf_merged)