从图像中提取文本时,分别突出显示文本

时间:2019-10-18 07:18:57

标签: java ocr tesseract

如何分别突出显示从图像中提取的每个文本。

我提供了将图像转换为文本文件的代码,其中将tesseract用作OCR技术。

   public class Sample{ 
        public static void main(String[] args) 
        { 
            Tesseract tesseract = new Tesseract(); 
            try { 

                tesseract.setDatapath("D:/Tess4J/tessdata"); 

                String text 
                    = tesseract.doOCR(new File("image.jpg")); 

                System.out.print(text); 
            } 
            catch (TesseractException e) { 
                e.printStackTrace(); 
            } 
        }

1 个答案:

答案 0 :(得分:0)

我不太确定“从图像中单独提取单个文本”是什么意思。但是我会猜。 如果要拆分从图像中获取的文本,请使用下一步:

text.split("some symbol");

然后,您可以将零件添加到数组并使用ANSI代码为每个零件上色:

String[] array = text.split("some symbol");
for(int i=0; i<array.length; i++){
 System.out.print(ANSI_CODE+array[0]);
}

此帖子How to print color in console using System.out.println?将帮助您选择代码