问候Overflowers,
鉴于:
我可以为我的程序提供哪些最好的简单帮助,以便能够在所选单词周围绘制矩形?你会用什么算法来实现这个程序?我尝试过像OmniPage Pro这样的OCR,但它们没有提供这种功能。
此致
答案 0 :(得分:0)
几年前,我在我的应用程序中实现了一个单词边界框和突出显示的单词。你说“我有这种文本的简单数字格式”。一个关键组件是具有字符或单词的坐标,以便将它们映射到适当的图像区域。与可搜索的PDF一样,当您选择文本时,它会在内部映射到图像层,而图像上的相反选择则选择匹配的文本。但是即使从PDF那些坐标也无法导出我相信。如果您的文本中当前不存在此类坐标信息,则最简单的可能是使用高质量引擎重新OCR图像,该引擎可以生成坐标作为输出的一部分。如果您使用WiseTREND OCR Cloud 2.0,那么XML输出将生成所有详细的元数据。如果存在坐标信息,则所有主要组件都在那里,它只是围绕有效的UI设计工作。