标签: r pdf image-processing
我有一个主要是文本和边框的pdf,但编码已损坏,因此我基本上需要将其渲染为二进制图像,以便我可以执行边缘检测以对其进行分割,并使用ocr来解析文件。
现在我正在使用pdftools将其渲染为彩色图像,然后magick将其转换为双层图像,但这需要花费太多时间。
pdftools
magick
在R中有更快/更直接的方法吗?