我有一个图像文件,其中包含一些用制表符分隔的文本(2个空格)。但是,当我从该图像文件中提取文本时,两列之间始终只有一个空格。一个示例示例:
图像:
col-a col-b col-c
所需的输出:
col-a col-b col-c
但是我得到以下信息:
col-a col-b col-c
我正在使用pytesseract.image_to_string(Python模块)将图像转换为文本
答案 0 :(得分:2)
像这样使用它:
pytesseract.image_to_string(img, config='-c preserve_interword_spaces=1')