图像的文本检测

时间:2010-04-07 15:26:28

标签: algorithm image-processing ocr

我得到了廉价相机制作的灰度图像,我需要制作一个程序OCR。 主要问题是噪声或对象不是文本,但它们存在于二进制图像中。 现在我想到从图像中提取文本。

我需要一些好的算法。 你能推荐一个真正好的吗? 例如,如果图像包含黑色文本和类似黑色线条 然后该算法将只选择没有行的文本。

1 个答案:

答案 0 :(得分:2)

您描述了要删除的两种类型的噪音。 (BTW wikipedia page降噪效果不错,请看“图像中”部分。)

一种是奇数点噪声。这通常被称为“斑点”或“盐和胡椒”噪声,通常通过某种平均滤波器去除。在mathworks有一个很好的页面描述了一些算法。

第二种是线条。这更难,我不会将其描述为噪音,它将取决于您输入的图像类型。 This paper似乎合适,但无法在线免费提供,因此您可能需要购买或转到当地的大学图书馆。

您可能还想查看可从许多地方下载的this,但实际上是电影(视频),所以可能不是您想要的。