标签: r text-mining
我使用R分析PDF文档。当我尝试读取包含多列的PDF文档时遇到问题。逐行读取文档,将文本混合在一起。我希望能够逐栏阅读,任何人都可以帮助我吗?
这就是我阅读文档的方式
library(tm) files <- list.files(pattern = "pdf$") Rpdf <- readPDF(control = list(text = "-layout"))(elem = list(uri = files), language="en", id="id1")