OCR库用于照片,而不是扫描图像

时间:2010-03-31 18:14:13

标签: ocr

有没有人知道可以处理彩色照片的OCR库(而不是扫描页面)?

在我看来,大多数图书馆都使用B& W图像,并希望它们来自扫描仪。我需要的东西可以拍摄广告牌的彩色照片,并从中提取文字。

我正在考虑将这些图像转换为B& W tiff并将它们提供给this question中提到的其中一个库,但我持怀疑态度......这些库可能是围绕图像的假设而设计的是扫描文档或扫描书页。我需要能够在任何方向,不同大小,奇怪的对齐等方面对文本起作用的东西,基本上可以从这些图像中提取出最多的文本 - 它不必100%准确。

有什么想法吗?

1 个答案:

答案 0 :(得分:1)

您可以使用unpaper进行对齐。 OCR的gocr。通常,获得颜色输入的软件会在处理之前将其转换为灰度 - 它只是人类做的预处理步骤或软件本身。