我需要从TIFF文件中间提取/裁剪标识(BEAVER),如下所示:http://i41.tinypic.com/2i7rbie.jpg
然后我需要自动化这个过程,这样它可以重复大约900万次......
我的猜测是我必须使用一些OCR软件。但是,这样的软件是否有可能“在这一点之下完成任何低于这一点且超过这一点的任何东西”?
思考?
答案 0 :(得分:2)
通常,OCR软件仅从图像中提取文本并将其转换为某种特定于文本的格式。它没有作物。但是,您可以使用OCR技术来完成任务。我建议遵循:
真正的挑战在于您希望处理的文本数量。在定义“智能规则”时必须非常小心,以确保它们不会提供误报,并始终将可疑图像发送到单独的队列,稍后您将手动查看并更新规则。
一般情况下,它可能如下所示:
很可能你会遇到一些与现有规则相矛盾的奇怪图像,或者只是错误。并非总是必须更新您的规则以适应它。可能会发生在你的900万集合中只有十几个这样的图像。将它们留在异常队列中进行手动处理可能会更好,并且不会冒着你的魔法规则的稳定性风险。