是否有免费的OCR库可以提取文本以及检测文本上的某些标记?我意识到这是一个非常模糊的命题,这种功能在很大程度上取决于我想要检测的“标记”类型。
但据我所知,即使存在这样的事情,除了一些声称将扫描页面转换为可编辑文件同时保留原始页面布局的一些外观的商业软件包。我正在寻找一个我编程的图书馆。
我对这种图书馆的具体应用是这样的:
答案 0 :(得分:0)
最好的免费OCR工具可能仍然是Tesseract。您必须自己修改代码以识别标记相对于扫描文本的位置。
几年前,当我上次检查好的,免费的OCR图书馆时,他们很瘦。即使是封闭的源代码产品通常也不值得打扰,除非你想在上面花上$$$。