在Android上使用Tesseract tess-two分词

时间:2016-03-04 14:40:22

标签: java android tesseract tess-two

我尝试使用tesseract tess-two从android中的图像中读取问题和回答。目前,我在图像上的每个单词都得到一个字符串。 我的问题是,我无法拆分问题 是否可以用TessBaseAPI拆分answear? java / android中的解决方案也没问题;)

 public String detectText(Bitmap bitmap) {
    Log.d(TAG, "Initialization of TessBaseApi");
    TessDataManager.initTessTrainedData(context);
    TessBaseAPI tessBaseAPI = new TessBaseAPI();
    String path = TessDataManager.getTesseractFolder();
    Log.d(TAG, "Tess folder: " + path);
    tessBaseAPI.setDebug(true);
    tessBaseAPI.init(path, "eng");
    tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST, "1234567890ABCDEFGHIJKLMNOPQRSTUVWXYZ" +
            "abcdefghijklnmopqrstuvwxyzäüößÄÖÜ!?@#$%^&*+=-;()/");
    tessBaseAPI.setPageSegMode(TessBaseAPI.OEM_TESSERACT_CUBE_COMBINED);

    Log.d(TAG, "Ended initialization of TessEngine");
    Log.d(TAG, "Running inspection on bitmap");
    tessBaseAPI.setImage(bitmap);

    String inspection = tessBaseAPI.getUTF8Text();
    Log.d(TAG, "Got data: " + inspection);
    tessBaseAPI.end();
    System.gc();
    return inspection;
}

Here is an example how the image look like

1 个答案:

答案 0 :(得分:0)

这就是它的工作方式:

#foreach($items in $question.options.L)
    {"awshack" : 
        [#foreach($item in $items.L)
            "$item.S"#if($foreach.hasNext),#end
        #end
    #if($foreach.hasNext),#end
]}#if($foreach.hasNext),#end
#end