我有Tesseract
通过pytesseract
在python中运行。
使用恰好包含约600个单词的报纸文章图像,pytesseract.image_to_string
函数大约需要20秒才能完成。
最终的结果很好,但是太慢了,几乎没有用。
图像的文件大小为3.5MB,分辨率为3024××4032(如果有用)。它已经通过opencv
完成了预处理。
在本地计算机上运行以及将其上传到Google Cloud平台时,大约需要18到20秒。
任何人都可以建议您加快此过程吗?
使用的pytesseract
版本是0.2.5。