标签: ios tesseract quartz-core text-recognition
我正在使用Tesseract进行文本识别。
如何简单地识别文本之间的填充并创建例如带有相同填充的pdf或.doc文件?
让我们说源页面包含3列文字(如新闻报道)。如何通过适当的填充和相互之间的边距以及页面来识别此文本?
也许你可以建议做相同或只是算法的例子或库?