如何检测图像中的单词

时间:2009-11-04 12:49:04

标签: c# image-processing ocr

我需要在用户点击的图片中找到该单词。到目前为止,我已经成功地对图像进行了OCR。我的c#app中有一个picturebox控件。用户可以在任何文本周围绘制一个框并将其拖动到文本框以使用它填充文本框。我已经完成了这个。但现在我有一个新的要求,即用户可以选择一个文本框,然后单击图像中的单词,以便在文本框中填写单词。

我不知道如何继续。如何从图像中单独剪切单词部分并将其提供给OCR。用户可以单击该单词的任何部分。

请给我任何指示。我应该遵循什么算法来查找用户点击的单词的边界。如果我找到了边界,我可以使用copyfromscreen方法从图像中剪切它,并将它发送到ocr引擎以获取文本。

希望我在这里明白我的问题。

谢谢和问候, 迪内希。

2 个答案:

答案 0 :(得分:2)

如果您正在使用OCR,我最初的方法是尝试以初始点击点为中心进行某种搜索。

IE中。在用户点击的地方做一个小盒子,OCR,如果所有的噪音,做一个更大的盒子,OCR,重复,直到OCR导致命中。

答案 1 :(得分:1)

如果您有OCR数据,则根据OCR库,您可以执行反向查找并确定指定像素坐标处的字符。我使用过的OCR库为每个字符提供了矩形坐标,而这些坐标又可以分组为单词(组合字符)。那么问题就是确定点击发生在哪个矩形内。