我如何去除背景噪音而只留下文字? 图片示例:
我的代码:
var Tesseract = require('tesseract.js');
var Jimp = require("jimp");
Jimp.read("12.png").then(function (image) {
image
.color([
{ apply: 'brighten', params: [20] }
])
.contrast(1)
.greyscale()
.write("img-opt.jpg");
})
.then(function() {
Tesseract.recognize('img-opt.jpg', {
tessedit_char_whitelist: 'AN%D%P'
})
.progress(function(message){console.log(message)})
.catch(function(err){console.error(err)})
.then(function(result){console.log(result.text)})
})
.catch(function (err) {
console.error(err);
});
我得到了这个结果:
那么,如何去除背景噪音? 谢谢!
答案 0 :(得分:1)
通过删除brigthen
转换,我得到了更好的结果。
另外,desaturate
似乎比grayscale
更好。
image
.color([{apply: 'desaturate', params: [90]}])
.contrast(1)
.write("img-opt.jpg");
您只需要一点点试验和错误即可。