我对tesseract创建的可搜索PDF有问题。它不会生成,我会根据自己在Github上的示例按照自己的方式在C ++项目中执行此操作-pdfrenderer.cpp 但是,当我在Firefox中打开PDF文档时,每个单词之间都缺少空格,而在Chromium中则没有。有人知道为什么吗?我找不到任何东西。我在使用tesseract v4的Ubuntu 18.01下工作(在使用tesseract v3.x的ubuntu 17.xx下也遇到了同样的问题。)
编辑1:示例PDF-Example PDF