OCR PDF缺少Firefox中的空白

时间:2018-06-22 16:11:01

标签: pdf ocr tesseract pdf.js

我对tesseract创建的可搜索PDF有问题。它不会生成,我会根据自己在Github上的示例按照自己的方式在C ++项目中执行此操作-pdfrenderer.cpp 但是,当我在Firefox中打开PDF文档时,每个单词之间都缺少空格,而在Chromium中则没有。有人知道为什么吗?我找不到任何东西。我在使用tesseract v4的Ubuntu 18.01下工作(在使用tesseract v3.x的ubuntu 17.xx下也遇到了同样的问题。)

编辑1:示例PDF-Example PDF

0 个答案:

没有答案