如何使用tesseract检测同一图像中的多个方向文本?

时间:2018-11-01 02:29:16

标签: tesseract

Multiple text orientation in same image

在上图中,我只能检测到水平文本。我正在使用命令行tesseract。我可以在命令行中使用哪些参数选项来检测水平和垂直方向,甚至可以检测180或270度的文本。全部在一个图像中?是否可以在同一张图片中自动检测多个定向文本

它仅检测Hello World但检测到HI WORLD的一些垃圾字母。面向90度的文本失败。

2 个答案:

答案 0 :(得分:0)

您的原始图像中有2种不同的文本。我认为您可以逐步解决问题:

另请参阅: https://www.pyimagesearch.com/2018/09/17/opencv-ocr-and-text-recognition-with-tesseract/

答案 1 :(得分:0)

对于两种不同的文本方向。如果您的图像是固定的(所有图像都包含很少的文字和水平和垂直文本的组合)。尝试应用以下步骤:

  1. 将此图像传递给使用 psm 11/6 模式的 tesseract,您将获得水平图像。仅选择那些具有较高置信度的词。(如果在垂直阈值上检测到某些内容,则其置信度非常低。)
  2. 将图像旋转 90 度并再次以相同的 psm 传递到 tesseract,您将获得更准确的垂直文本。
  3. 您可以使用框的高度/宽度进行进一步验证。