Question

我正在尝试将附加的OCR jpeg文件转换为文本。当我使用pytesseract或tesseract时，我会看到变音符号。因此，我的输出中包含很多垃圾字符。 jpeg到文本的转换不起作用。

我厌倦了从图像文件中读取，提取文本并使用击键进行打印。未达到预期输出的地方。代码如下：

image=Image.open('8001.jpg')
text = image_to_string(image, lang='eng')
keyboard.write(text)

我收到了一些不需要的字符

））7？）7 0 破晓：出现了。割草使我们受伤了，乌布·布（Urey 2001）清除了J Wea的声音

pm 0. 0））aeaboul lo检查船体，它实际上是在水平方向上形成的 2

fatfoun，如果感到不适运纳尔，踢回响板。 “打开，

）我“ 57 逐渐下沉。哦!迷惑我！哭了点头

0 Q yi 你真是太不可思议了！

说Pp iy ui

0 0 cide，来自Boal内部。一个iton盘子被移动了，一个男人出现了，很生气