标签: hadoop tesseract hadoop-streaming hadoop-plugins
根据我的图像处理项目。我需要的是将hadoop(并行处理器)与tesseract(图像处理到txt)集成。
答案 0 :(得分:0)
您可能会发现OSSOCR有用。它包含一个名为python-tesseract的模块,用于OCR处理。您可以将它与Hadoop流式传输一起使用。