在Tesseract中保存空间

时间:2018-08-03 08:26:54

标签: python python-tesseract

我有一个图像文件,其中包含一些用制表符分隔的文本(2个空格)。但是,当我从该图像文件中提取文本时,两列之间始终只有一个空格。一个示例示例:

图像:

col-a    col-b    col-c

所需的输出:

col-a    col-b    col-c

但是我得到以下信息:

col-a col-b col-c

我正在使用pytesseract.image_to_string(Python模块)将图像转换为文本

1 个答案:

答案 0 :(得分:2)

像这样使用它:

pytesseract.image_to_string(img, config='-c preserve_interword_spaces=1')