我正在寻找一个能够运行免费服务器的OCR库(例如免费的Python / PHP webhost,Google App Engine,OpenShift)。 Tesseract似乎为我的使用提供了足够准确的结果(OCRing一个简短的单词)。但是,它是用C语言编写的,并且无法在免费服务器上运行,或者至少到目前为止我遇到过的服务器。我无法提供自己的服务器,因为我没有资源(只有一台笔记本电脑并不总是打开)。任何帮助将不胜感激。谢谢
答案 0 :(得分:3)
当我发布此回答谷歌转换服务似乎确实是一个很好的解决方案,但在2012年8月15日谷歌宣布转换服务将在2012年11月被删除。
Appengines转换服务确实支持OCR developers.google.com/appengine/docs/python/conversion/overview
如果您只是在实例启用了远程api时,您甚至不需要在服务器上运行它。以下是通过remote_api调用OCR服务的示例,而不必在远程服务器上部署代码。
App Engine interactive console for qtrack-dev
>>> from google.appengine.api import conversion
>>> asset = conversion.Asset("text/html", "<b>some data</b>", "test.html")
>>> conversion_obj = conversion.Conversion(asset, "image/png")
>>> result = conversion.convert(conversion_obj)
Username:XXXXXg@gmail.com
Password:
>>> result.assets
[<google.appengine.api.conversion.conversion.Asset object at 0x9e4642c>]
>>> open('/tmp/x.png','w').write(result.assets[0].data)
>>>