将英语与受过方程训练的数据一起使用tesseract tess4j

时间:2018-10-29 02:13:40

标签: java ocr tesseract tess4j

我正在尝试使用Java中的tess4j用数学方程式读取图像。但是,我认为它与字符重叠并且不能将英语与公式结合在一起。这是训练有素的数据问题吗?我怎样才能解决这个问题。下面是我的代码。

 ITesseract tess = new Tesseract();
        try {
            tess.setLanguage("eng+equ");
            String imageURL = "http://www.blah.com/images/test-exercises/exercises.png";
            URL url = new URL(imageURL);
            BufferedImage img = ImageIO.read(url);
            String result = tess.doOCR(img);
            System.out.println(result);
        } catch (TesseractException e) {
            e.printStackTrace();
        } catch (MalformedURLException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }

我得到的输出

a) ↥⊝≍⋉↥⋮↥↸⊣⊽≍ k) ↥⋅⊈⋉⇣≁⇃⋅↸≍⋉⇣⋮↸⋅∠⊽≁≍
⊔ ⇃⋅↸
3x ↸≍ ↸ e
7 4:7, ≓ ≓ z, 77
b) 1+ 1 1 1) 3” z») ∙≁−−
↥ ↥ ⋅
r) 17:71:3770 m) ≩∅⊣⇇⋜∅≁↥≻⊣∅≁⊈⋗⋉↖⋮↼↴
3 .
d) ↼↴≍⊣⋜⋮↥↥≍⋉↥∘ n) ⊈⇉≁≍⋮≹⋜⋉⊢⇃⋅∖⊢⊢≩≍≻
9) Liz: o) ⇇⋜↨≍≁⊈⋅↸⋮↥∘⋅−≁⊈⋉↥≟≍

Image Used for testing

0 个答案:

没有答案