我正在尝试使用pytesseract在python中提取图像的内容。我得到了输出,但是对于某些图像,我无法提取内容。 例子
我得到以下错误输出:
‘Happiness is. a choice,
lo Tmest Mella A egy
Ce Re
gran
Tate Tae
Manta tan oa ae)
Cg
ed
unas
有人可以帮助我吗?
答案 0 :(得分:1)
Pytesseract最适合使用简单字体的文本。您所提供的图片是草书,因此pytesseract很难区分字母。这就是为什么它不能正常工作的原因。您可以尝试更改pytesseract中的参数以获得更好的结果,但是我非常怀疑您是否可以获得完整的文本。
如果您想改善结果,可以参考以下链接:https://www.pyimagesearch.com/2017/07/10/using-tesseract-ocr-python/