使用pytesseract在python中进行图像处理是否总能提供正确的输出?

时间:2019-02-24 10:46:38

标签: python

我正在尝试使用pytesseract在python中提取图像的内容。我得到了输出,但是对于某些图像,我无法提取内容。 例子

我得到以下错误输出:

‘Happiness is. a choice,
lo Tmest Mella A egy
Ce Re
gran
Tate Tae
Manta tan oa ae)

Cg

ed
unas

有人可以帮助我吗?

1 个答案:

答案 0 :(得分:1)

Pytesseract最适合使用简单字体的文本。您所提供的图片是草书,因此pytesseract很难区分字母。这就是为什么它不能正常工作的原因。您可以尝试更改pytesseract中的参数以获得更好的结果,但是我非常怀疑您是否可以获得完整的文本。

如果您想改善结果,可以参考以下链接:https://www.pyimagesearch.com/2017/07/10/using-tesseract-ocr-python/