应用错误收集

时间：2018-05-13 10:27:36

标签： python google-cloud-platform ocr

我需要您的输入才能找到一种在扫描图像中找到文本段落的一般方法，并将其突出显示。

当使用谷歌云中的OCR功能时，我只是获取图像中所有单词的数组，包括位置。所以我可以找到一个单词并突出显示它，因为我可以搜索单词并找到它的位置。

但是我怎么能搜索文本段落呢？

我很乐意从你那里得到一些想法:)

谢谢！

答案 0 :(得分：0)

我猜对于OCR，您的意思是 Optical character recognition 。

我可以想到这个遥不可及的解决方案（假设您的位置分别是x和y坐标）：

-创建一个包含所有单词的有序列表。顺序应该这样：*：如果x1> x2 AND y1 = y2（水平排序）或x1 = x2 AND y1> y2（行排序），则word1> word2。

-查找段落的第一个单词，检查列表中的下一个条目是否匹配，依此类推。一种更简单的方法是找到第一个和最后一个单词，以突出显示两个单词之间的每个单词，但是如果单词很常见，则会重叠。

只要文字不是非常倾斜，它就应该起作用。如果是，则应计算倾斜度并进行校正。

* EDIT：如果您先对行进行排序，然后对单词进行排序，也许会更容易。之后，加入列表。