image-processing - 图像中的半自动文字突出显示？

图像中的半自动文字突出显示？

时间：2011-03-02 05:00:49

标签： image-processing automation ocr

问候Overflowers，

鉴于：

我有包含混合语言文字的文件图片
我希望最终用户能够突出显示此文本（逐字逐句）
我已经以简单的数字格式提供此文本
我会帮助我的程序找出单词的位置
我不希望我的帮助对我来说很乏味
我还会手动修复程序后的小错误

我可以为我的程序提供哪些最好的简单帮助，以便能够在所选单词周围绘制矩形？你会用什么算法来实现这个程序？我尝试过像OmniPage Pro这样的OCR，但它们没有提供这种功能。

此致

1 个答案:

答案 0 :(得分：0)

几年前，我在我的应用程序中实现了一个单词边界框和突出显示的单词。你说“我有这种文本的简单数字格式”。一个关键组件是具有字符或单词的坐标，以便将它们映射到适当的图像区域。与可搜索的PDF一样，当您选择文本时，它会在内部映射到图像层，而图像上的相反选择则选择匹配的文本。但是即使从PDF那些坐标也无法导出我相信。如果您的文本中当前不存在此类坐标信息，则最简单的可能是使用高质量引擎重新OCR图像，该引擎可以生成坐标作为输出的一部分。如果您使用WiseTREND OCR Cloud 2.0，那么XML输出将生成所有详细的元数据。如果存在坐标信息，则所有主要组件都在那里，它只是围绕有效的UI设计工作。