我正在将tesseract.js与nodeJs一起使用来识别图像中的阿拉伯文本 但不幸的是,它给我的文本与输入图像的文本不符。
输入: 1
输出: 2
var tesseract = require('tesseract.js')
var request = require('request')
var fs = require('fs')
var util = require('util');
var path = 'C:/Users/Lenovo/Desktop/projet'
var log_file = fs.createWriteStream(path + '/arab.txt', {flags : 'w'});
var log_stdout = process.stdout;
var filename = 'capture.PNG'
tesseract.create({ langPath: "ara.cube.fold" })
.recognize(filename, 'ara')
.progress(function (p) { console.log('progress', p) })
.catch(err => console.error(err))
.then(function (result) {
console.log = function(result) {
log_file.write(util.format(result) + '\n');
log_stdout.write(util.format(result) + '\n');
};
console.log(result.text)
process.exit(0)
})
有什么解决办法!