我希望能够比较在同一文档上运行OCR三次得到的结果。有没有可以用来实现这一目标的工具?
我想比较三个文档,并根据3/3次或2/3次相同的字符,创建第四个文档,并输出此决定。我正在使用Abby Fine阅读器,它给了我很好的结果,但我正努力做到尽我所能达到100%。
我知道微软有一个"比较文件"功能,我希望能够通过强大的算法在更大范围内进行这种类型的分析。
任何想法?
谢谢你的时间!
答案 0 :(得分:1)
如果输出是一个简单的文本文件,您可以使用bash diff
命令和一个简单的shell脚本来比较它们。然后,您可以使用稍微复杂的shell脚本来解析输出文件并创建最终文档。