因此,我必须将Tesseract生成的多页框文件转换为OpenCV矩阵坐标以裁剪图像ROI。问题是写入框文件的坐标值与OpenCV中的图像坐标系不同。
包装盒文件如下:
Page 0
H 357 1494 422 1562 0
9 453 1495 515 1560 0
3 556 1494 605 1560 0
V 634 1494 694 1561 0
F 726 1495 786 1562 0
1 828 1495 854 1562 0
L 908 1495 971 1562 0
Page 1
H 371 1369 434 1425 1
9 461 1372 519 1425 1
3 556 1373 606 1427 1
V 634 1376 694 1430 1
F 718 1378 780 1432 1
1 820 1378 846 1435 1
L 893 1379 954 1437 1
如果打开坐标槽jTessBoxEditor,数字值将转换为图像坐标系:
jTessBoxEditor coordinates in image page 0
jTessBoxEditor coordinates in image page 1
我确实知道Tesseract框文件中的坐标值是左下坐标系,而OpenCV图像坐标值是左上。我试图通过计算Box文件和jTessBoxEditor中的值之间的差异来转换这些坐标值,问题是每页的这些值之间的差异是不同的。
那么将多页框文件中的坐标值转换为OpenCV中的图像坐标系的最佳方法是每页,而无需尝试一个个地进行计算吗?