R将pdf转换为二进制图像

时间:2018-04-10 07:10:54

标签: r pdf image-processing

我有一个主要是文本和边框的pdf,但编码已损坏,因此我基本上需要将其渲染为二进制图像,以便我可以执行边缘检测以对其进行分割,并使用ocr来解析文件。

现在我正在使用pdftools将其渲染为彩色图像,然后magick将其转换为双层图像,但这需要花费太多时间。

在R中有更快/更直接的方法吗?

0 个答案:

没有答案