我正在使用 pytesseract 和内置函数 image_2_data 来获取图像中单词的边界框。
这很有效,但我的数据中的每个单词都有一个边界框。我想要的是所有彼此靠近的单词的边界框,以便我稍后可以更好地标记它。
所以,我所拥有的信息是“2014 年 2 月 19 日”。 image_to_data 给了我:
onResume
我需要的是:
"bbox": [1208, 772, 1246, 794], "text": "19."
"bbox": [1261, 771, 1363, 794], "text": "Februar"
"bbox": [1375, 772, 1443, 794], "text": "2014"
由于我的图像中有很多文字,因此对以后的所有步骤进行排序确实很有帮助。
预先感谢并致以亲切的问候!
编辑:这是我的意思的一个例子。