我在命令行中使用Windows 7中的tesseract.exe,在扫描OCR图像时,我以连续行输出。我希望它在文字中完全按照它在图像中的方式。这些变化是否有命令行参数?任何帮助将不胜感激。
答案 0 :(得分:1)
这是因为Tesseract只将换行符放在一行的末尾,而不是像Windows记事本那样的回车符+换行符。一个简单的解决方法是将结果输出到stdout并将此输出重定向到文件中:
tesseract.exe eurotext.tif - > result.txt
而不是
tesseract.exe eurotext.tif result