计算机视觉 - 使用图像匹配或OCR识别仅限文本的页面?

时间:2011-08-10 21:15:14

标签: image-processing opencv computer-vision ocr tesseract

我希望能够识别出我所在的文本页面(无图像)...最佳方法是什么:

我最初在考虑某种图像匹配,但是所有教科书的页面看起来都很相似,不确定它的效果如何?

第二个想法是使用OCR ??

任何想法或建议......谢谢!

1 个答案:

答案 0 :(得分:2)

我认为图像匹配在你的情况下真的没用... 如果您想检测您所在的页面以及该书是否有编号页面,您可以使用像Tesseract这样的OCR。

  • 1)找到页码(左上角,右下角......)
  • 2)提取它(提取图像以继续解码)
  • (2bis)预处理图像......)
  • 3)对其进行解码(使用Tesseract或其他OCR)

如果您不想使用OCR,您可以查看Hu Moments,如果这些数字是标准打印数字,则可以很好地识别它们。