应用错误收集

计算机视觉 - 使用图像匹配或OCR识别仅限文本的页面？

时间：2011-08-10 21:15:14

标签： image-processing opencv computer-vision ocr tesseract

我希望能够识别出我所在的文本页面（无图像）...最佳方法是什么：

我最初在考虑某种图像匹配，但是所有教科书的页面看起来都很相似，不确定它的效果如何？

第二个想法是使用OCR ??

任何想法或建议......谢谢！

1 个答案:

答案 0 :(得分：2)

我认为图像匹配在你的情况下真的没用... 如果您想检测您所在的页面以及该书是否有编号页面，您可以使用像Tesseract这样的OCR。

1）找到页码（左上角，右下角......）
2）提取它（提取图像以继续解码）
（2bis）预处理图像......）
3）对其进行解码（使用Tesseract或其他OCR）

如果您不想使用OCR，您可以查看Hu Moments，如果这些数字是标准打印数字，则可以很好地识别它们。