Question

我正在OCR中为汉字做一个项目。但问题是我需要让用户在方框中使用光标来选择他们希望系统扫描并识别字符的图像部分。有谁知道怎么做？我需要做像COCR2这样的事情。

Answer 1

我假设你有一个winforms项目。有一个带文本图像的图像框。您应该将MouseDown，MouseUp，MouseMove的事件处理程序添加到您的图片框中。当鼠标停止时，你保存信息在图像上第二秒的点是什么，并添加一些bool以记住选择开始。

当鼠标按下时 - 你会看到选择是否已经开始，如果是 - 请将鼠标向下拉起来，然后将鼠标向上移动并使用params smth克隆源图像

Image imgforRecognition = image.Clone(start.X, start.Y, end.X, end.Y);

然后将imgforRecognition传递给您的OCR引擎。

Answer 2

我曾经做过这样的项目。这是关于模式识别。你可能最终会使用神经网络来教你汉字。

图像库可以从图像中挑选一块（如LexRema描述的那样）。在我们这样做之后，我们将图像部分调整为大小，比如10x10像素，将颜色转换为黑白值（0和1）。

这将创建二进制数据的映射。您必须教导神经网络您传递的数据是您告诉的角色。这是非常默认的，我确信网上有很多神经网络示例。

祝你好运！