应用错误收集

多决策引擎，用于提高OCR准确度

时间：2010-12-16 22:24:40

标签： ocr

我希望能够比较在同一文档上运行OCR三次得到的结果。有没有可以用来实现这一目标的工具？

我想比较三个文档，并根据3/3次或2/3次相同的字符，创建第四个文档，并输出此决定。我正在使用Abby Fine阅读器，它给了我很好的结果，但我正努力做到尽我所能达到100％。

我知道微软有一个＆＃34;比较文件＆＃34;功能，我希望能够通过强大的算法在更大范围内进行这种类型的分析。

任何想法？

谢谢你的时间！

1 个答案:

答案 0 :(得分：1)

如果输出是一个简单的文本文件，您可以使用bash diff命令和一个简单的shell脚本来比较它们。然后，您可以使用稍微复杂的shell脚本来解析输出文件并创建最终文档。