将OCR jpeg文件转换为文本

时间:2019-06-12 13:11:00

标签: ocr tesseract python-tesseract

我正在尝试将附加的OCR jpeg文件转换为文本。当我使用pytesseract或tesseract时,我会看到变音符号。因此,我的输出中包含很多垃圾字符。 jpeg到文本的转换不起作用。

我厌倦了从图像文件中读取,提取文本并使用击键进行打印。未达到预期输出的地方。 代码如下:

image=Image.open('8001.jpg')
text = image_to_string(image, lang='eng')
keyboard.write(text)

我收到了一些不需要的字符

))7? )7 0 破晓:出现了。割草使我们受伤了,乌布·布(Urey 2001)清除了J Wea的声音

  

pm 0. 0))aeaboul lo检查船体,它实际上是在水平方向上形成的   2

fatfoun,如果感到不适   运   纳尔,踢回响板。 “打开,

)我“ 57    逐渐下沉。哦!迷惑我!哭了点头

0 Q yi    你真是太不可思议了!

说Pp iy ui

0 0    cide,来自Boal内部。一个iton盘子被移动了,一个男人出现了,很生气

0 个答案:

没有答案