JavaScript中的现有OCR脚本

时间:2011-11-28 17:27:34

标签: javascript neural-network ocr

我有一个关于CMS增强的想法,从图像中提取文本信息(例如,扫描的文档),并想知道是否有任何东西可以帮助我吗?

基本上,我想知道是否存在用JavaScript编写的现有OCR脚本,可以从图像中提取句子/单词(例如,使用canvas)。

我知道有些脚本执行相对较小的任务,例如验证码破解,但我还没有遇到提取完整句子的脚本。

有这样的事情,还是我需要从头开始编写?

3 个答案:

答案 0 :(得分:4)

Antimatter15的Ocrad.js is a possibility

答案 1 :(得分:3)

看看https://github.com/selead/node-ocr。这是一个访问{{s3}}服务的CoffeeScript库。

答案 2 :(得分:3)

node.js tesseract有一个available on github模块。