多决策引擎,用于提高OCR准确度

时间:2010-12-16 22:24:40

标签: ocr

我希望能够比较在同一文档上运行OCR三次得到的结果。有没有可以用来实现这一目标的工具?

我想比较三个文档,并根据3/3次或2/3次相同的字符,创建第四个文档,并输出此决定。我正在使用Abby Fine阅读器,它给了我很好的结果,但我正努力做到尽我所能达到100%。

我知道微软有一个"比较文件"功能,我希望能够通过强大的算法在更大范围内进行这种类型的分析。

任何想法?

谢谢你的时间!

1 个答案:

答案 0 :(得分:1)

如果输出是一个简单的文本文件,您可以使用bash diff命令和一个简单的shell脚本来比较它们。然后,您可以使用稍微复杂的shell脚本来解析输出文件并创建最终文档。