Question

我试图通过查看每行中黑色像素的总和来逐行分割下面的缅甸语文本图像（最终按音节音节，但一步一步）（附加的图表连同代码用来生产它）。如何使用黑色像素信息总和来分割文本图像？

编辑：注意线条彼此非常接近，所以我在使用cv2 dilation / erosion / findcontour进行分段时遇到了一些麻烦。我已经在Split text lines in scanned document尝试了这个方法，就像@Miki建议的那样。在文本图像中，总共有6行文本。可能是由于文字字符看起来像缅甸文字一样，我不断得到分段上下。因此，我最终只是根据每行中黑色像素的总和做出决定。

TextImage

PlotOfBlkPixelSumByRow

import matplotlib.pyplot as plt
import cv2


image = cv2.imread('TextImage.PNG')
gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)
ret,thresh = cv2.threshold(gray,127,255,cv2.THRESH_BINARY_INV)
cv2.imshow('binary',thresh)
cv2.waitKey(0)

thresh_sum = thresh.sum(axis=1)
plt.plot(thresh_sum)

谢谢！

python分段逐行文本的图像

0 个答案: