正如标题所指出的,我收集的大多数图像都有深色背景和浅色单词,这使得tesseract很难识别嵌入的文本。任何人都知道如何用TextCleaner交换两种颜色?谢谢!
答案 0 :(得分:2)
我的textcleaner脚本中没有标记。但我会尝试添加一个。现在你可以通过将-negate ImageMagick命令输入到脚本中来实现:
convert input -negate miff:- | textcleaner -f 20 -o 10 - output
编辑:我刚刚发布了另一个版本的脚本,允许一次或两次反转。所以上面的例子是
textcleaner -f 20 -o 10 -i 1 input output
其中-i 1表示反转输入的颜色。如果要反转颜色,则处理然后再次反转输出,然后使用-i 2。
请注意,如果您使用textcleaner进行商业用途,请与我联系以获取许可。