我分别有tesseract-ocr和hadoop。我需要整合它们

时间:2013-06-13 06:22:16

标签: hadoop tesseract hadoop-streaming hadoop-plugins

根据我的图像处理项目。我需要的是将hadoop(并行处理器)与tesseract(图像处理到txt)集成。

1 个答案:

答案 0 :(得分:0)

您可能会发现OSSOCR有用。它包含一个名为python-tesseract的模块,用于OCR处理。您可以将它与Hadoop流式传输一起使用。