应用错误收集

R将pdf转换为二进制图像

时间：2018-04-10 07:10:54

标签： r pdf image-processing

我有一个主要是文本和边框的pdf，但编码已损坏，因此我基本上需要将其渲染为二进制图像，以便我可以执行边缘检测以对其进行分割，并使用ocr来解析文件。

现在我正在使用pdftools将其渲染为彩色图像，然后magick将其转换为双层图像，但这需要花费太多时间。

在R中有更快/更直接的方法吗？

0 个答案:

没有答案