我正在尝试预处理图像,以便在使用tesseract时提高准确性。为了解决这个问题,我如何通过Python以编程方式应用ImageMagick bash shell脚本textcleaner。
答案 0 :(得分:2)
从-http://www.fmwconcepts.com/imagemagick/textcleaner/index.php下载textcleaner脚本,并将其放置在编写python脚本的文件夹中
bashCommand =“ sh textcleaner -g -e Stretch -f 25 -o 20 -t 30 -u -s 1 -T -p 20 input_file.format output_file.format” 创建一个bash命令来运行textcleaner来处理图像。 Tweek的参数以获得更好的处理图像。
导入子过程 进程= subprocess.Popen(bashCommand.split(),stdout = subprocess.PIPE) 输出,错误= process.communicate() 运行此代码以获取处理后的图像。