我尝试从西班牙语的图像(jpg)获取文本,但结果是奇怪的字符。 我的代码是这样的:
import pytesseract
from PIL import Image, ImageEnhance, ImageFilter
from pytesseract import image_to_string
#url image
path = 'media/norms/temp.jpg'
#get the text
image = Image.open(path)
text = pytesseract.image_to_string(image, lang='spa')
print(text)
结果如下:
,, .…c……
1…¡_»€…m.a…m…1 ¿a¿f¿¿3_…k
k…mmy … y
: … … … o……… …… … … s…… … ………º… … … W……
¿.º…………… n …… ……a.…………… …… …… …… ………… …
EN……—
o.… =¡ …… 13 M … Novrr|!5 & Rewqu c…… c…e……… de P……
me…… ue no…… a… …… dncnnuumz m… m…… 51Ru¡xglm …… Nm
157 de m de …… ¿. zum… mm… w.… eslab1:mmnnms que va…… a s……
p…au……=nn.na……n cnm¿vmmnsln1aime> .q………uyuo…e…m……
… a. … xul7ve …… Pvácncas He Ma…rmwa= pam … men…… de pmducms
!u'mauáuHmscue ¡e =…x…e… … uuurma Dmumlunsl ¡—
这是我的形象:
这是我的文件夹tesseract:
请一点建议或评论谢谢!!