手写文本识别php

时间:2011-08-07 22:14:51

标签: php ocr handwriting-recognition

我正在考虑创建一个特定的Web系统。它涉及许多不同的(随机)人上传他们所写内容的扫描文档。

是否有任何PHP开源方式将这些手写文本转换为机器文本?

我发现了这个question,但想知道它是否能识别出很多随机的&不同的人的写作?

有没有人有经验分享这个领域?

3 个答案:

答案 0 :(得分:2)

我使用tesseract-ocr

从php完成了ocr

http://code.google.com/p/tesseract-ocr/

结果不是很好,我怀疑它支持手写 但我很想知道其他人做了什么

答案 1 :(得分:2)

请参阅SO上的相关问题:handwriting recognition with simple training

基于图像的手写识别也称为Off-line handwriting recognition

如果手写字符始终为capital-letter, post-office style,则可由Intelligent Character Recognition (ICR)处理,这是基于图像的。

离线(基于图像)和在线(实时)识别之间的区别在于后者要求您在写入时记录每个笔划的时间戳(位置和速度)。

基于图像的识别引擎可以通过将带时间戳的笔划转换为图像来处理在线数据。相反,在线识别引擎不能处理基于图像的输入。因此,在线识别在技术上更容易,并且开源项目可用。

一些维基百科文章包含OCR / ICR软件提供商列表:

在线手写识别引擎(开源)的一个例子:

答案 2 :(得分:1)

这是不可能的,因为手写过多,计算机程序可以找到识别其中文本的模式。您可以尝试使用OCR,理想情况下可以使用与PHP良好接口的库,例如:通过shell为启动器。请参阅Ocrad - The GNU OCR