应用错误收集

JavaScript中的现有OCR脚本

时间：2011-11-28 17:27:34

标签： javascript neural-network ocr

我有一个关于CMS增强的想法，从图像中提取文本信息（例如，扫描的文档），并想知道是否有任何东西可以帮助我吗？

基本上，我想知道是否存在用JavaScript编写的现有OCR脚本，可以从图像中提取句子/单词（例如，使用canvas）。

我知道有些脚本执行相对较小的任务，例如验证码破解，但我还没有遇到提取完整句子的脚本。

有这样的事情，还是我需要从头开始编写？

3 个答案:

答案 0 :(得分：4)

Antimatter15的Ocrad.js is a possibility

答案 1 :(得分：3)

看看https://github.com/selead/node-ocr。这是一个访问{{s3}}服务的CoffeeScript库。

答案 2 :(得分：3)

node.js tesseract有一个available on github模块。