我想知道是否有人曾使用Tesseract和ImageMagick从图像中获取精确的文本。我主要担心的是图像中存在的小字体文本(或一些不清晰可见的文本)。我能够检索那些不清楚文本的唯一方法是通过ImageMagick修改图像 - 通过缩放图像,有时裁剪图像....
我想知道是否有人集成了ImageMagick和Tesseract来创建更强大的工具?
答案 0 :(得分:4)
到目前为止,我已经提出了一个可以搜索图像中文本的脚本......该脚本使用了imagemagick和tesseract。该脚本仍处于开发阶段,但您可以查看它here