我的基本要求是我有从OCR工具生成的文本文档,现在我想确定哪种类型的文档。护照,驾驶执照,银行对帐单,S.S.N。 / Aadhar,以编程方式通过java。任何指针/启动器都会有帮助。谢谢
答案 0 :(得分:0)
需要什么:使用"模糊搜索"进行关键字的内容解析或者"狂野的角色"以适应OCR可能出现的错误。这些文档很难并且肯定包含由于背景等导致的OCR错误。搜索多个关键字以实现冗余和更宽容的分类。
如何:许多在线资源。我建议从#34;文本解析"。
的通用研究开始