Tesseract.js不适用于阿拉伯语吗?

时间:2018-07-11 15:18:38

标签: node.js ocr tesseract arabic

我正在将tesseract.js与nodeJs一起使用来识别图像中的阿拉伯文本 但不幸的是,它给我的文本与输入图像的文本不符。

输入: 1

输出: 2

var tesseract = require('tesseract.js')
var request = require('request')
var fs = require('fs')
var util = require('util');
var path = 'C:/Users/Lenovo/Desktop/projet'
var log_file = fs.createWriteStream(path + '/arab.txt', {flags : 'w'});
var log_stdout = process.stdout;
var filename = 'capture.PNG'
tesseract.create({ langPath: "ara.cube.fold"  })
       .recognize(filename, 'ara')
       .progress(function  (p) { console.log('progress', p)  })
       .catch(err => console.error(err))
       .then(function (result) {
    console.log = function(result) {
      log_file.write(util.format(result) + '\n');
      log_stdout.write(util.format(result) + '\n');
     };
    console.log(result.text)
    process.exit(0)
})

有什么解决办法!

0 个答案:

没有答案