标签: r parallel-processing pdftotext
我正在尝试将.pdf文件(大部分是基于图像的)批量转换为.txt文件。以下程序成功地将基于文本和图像的pdf转换为文本文件。
我的问题是,有一组约15个pdf文件需要很长时间才能转换。它们不是特别大(最大页数在10到600之间),但我的程序大约需要45分钟来转换它们。
为什么转换它们需要这么长时间,如何加快速度?我正在使用CRAN RGui(64位)和R版本3.5.0
.pdf文件位于以下hirarchy
等。
代码如下:
worldFront