我有一个关于CMS增强的想法,从图像中提取文本信息(例如,扫描的文档),并想知道是否有任何东西可以帮助我吗?
基本上,我想知道是否存在用JavaScript编写的现有OCR脚本,可以从图像中提取句子/单词(例如,使用canvas
)。
我知道有些脚本执行相对较小的任务,例如验证码破解,但我还没有遇到提取完整句子的脚本。
有这样的事情,还是我需要从头开始编写?
答案 0 :(得分:4)
Antimatter15的Ocrad.js is a possibility
答案 1 :(得分:3)
看看https://github.com/selead/node-ocr。这是一个访问{{s3}}服务的CoffeeScript库。
答案 2 :(得分:3)
node.js tesseract有一个available on github模块。