Java OCR库建议?

时间:2013-07-23 11:21:48

标签: java ocr

我需要查看一大堆图片,看看他们是否有关键字。任何人都可以推荐一个好的,可靠的OCR库吗?我很乐意为了准确而牺牲速度。

2 个答案:

答案 0 :(得分:22)

没有具有something to do with accuracy的纯Java OCR库。根据您的预算,您可以选择非纯Java的东西,但可以从Java调用:

  • 如果您有足够的时间但零预算 - 您的选择是Tesseract。它在开源中是最好的
  • 如果您的预算支出很少而且您只需要进行一次此次识别 - Cloud OCR API服务将是您的最佳选择。它基于领先的纪律级OCR引擎,并提供相当实惠的每个项目的价格。免责声明:我为ABBYY工作
  • 如果您需要永久性地将此识别作为持续流程运行,那么您可能会认为购买专用转换软件在经济上更有效率,例如this one,它具有API并且可以从Java调用太。但是,如果你准备在许可方面投入一些预算,实际上有很多选择。

答案 1 :(得分:2)

如果您计划识别非拉丁语或数字符号,那么最好找到非Java库,但从某些(外部)工具中选择并使用其他方式(1)来获取您的文本。 在Linux上,我通过命令行界面使用了cuneiform(2)。

  1. 命令行界面和管道,例如。

  2. 楔形文字已在Linux上移植但我不知道Windows的工作命令行界面