我正在尝试将附加的OCR jpeg文件转换为文本。当我使用pytesseract或tesseract时,我会看到变音符号。因此,我的输出中包含很多垃圾字符。 jpeg到文本的转换不起作用。
我厌倦了从图像文件中读取,提取文本并使用击键进行打印。未达到预期输出的地方。 代码如下:
image=Image.open('8001.jpg')
text = image_to_string(image, lang='eng')
keyboard.write(text)
我收到了一些不需要的字符
))7? )7 0 破晓:出现了。割草使我们受伤了,乌布·布(Urey 2001)清除了J Wea的声音
pm 0. 0))aeaboul lo检查船体,它实际上是在水平方向上形成的 2
fatfoun,如果感到不适 运 纳尔,踢回响板。 “打开,
)我“ 57 逐渐下沉。哦!迷惑我!哭了点头
0 Q yi 你真是太不可思议了!
说Pp iy ui
0 0 cide,来自Boal内部。一个iton盘子被移动了,一个男人出现了,很生气