如何使用TextCleaner处理带有深色背景的浅色文本

时间:2017-12-18 23:26:41

标签: imagemagick ocr

正如标题所指出的,我收集的大多数图像都有深色背景和浅色单词,这使得tesseract很难识别嵌入的文本。任何人都知道如何用TextCleaner交换两种颜色?谢谢!

1 个答案:

答案 0 :(得分:2)

我的textcleaner脚本中没有标记。但我会尝试添加一个。现在你可以通过将-negate ImageMagick命令输入到脚本中来实现:

convert input -negate miff:- | textcleaner -f 20 -o 10 - output


编辑:我刚刚发布了另一个版本的脚本,允许一次或两次反转。所以上面的例子是

textcleaner -f 20 -o 10 -i 1 input output

其中-i 1表示反转输入的颜色。如果要反转颜色,则处理然后再次反转输出,然后使用-i 2。

请注意,如果您使用textcleaner进行商业用途,请与我联系以获取许可。