消除图像文本节点中的噪音

时间:2018-11-01 21:39:56

标签: node.js

我如何去除背景噪音而只留下文字? 图片示例:

enter image description here

我的代码:

var Tesseract = require('tesseract.js');
var Jimp = require("jimp");


Jimp.read("12.png").then(function (image) {
    image
        .color([
          { apply: 'brighten', params: [20] }
        ])
        .contrast(1)
        .greyscale()
        .write("img-opt.jpg");
})
.then(function() {
  Tesseract.recognize('img-opt.jpg', {
      tessedit_char_whitelist: 'AN%D%P'
  })
    .progress(function(message){console.log(message)})
    .catch(function(err){console.error(err)})
    .then(function(result){console.log(result.text)})
})
.catch(function (err) {
    console.error(err);
});

我得到了这个结果:

enter image description here

那么,如何去除背景噪音? 谢谢!

1 个答案:

答案 0 :(得分:1)

通过删除brigthen转换,我得到了更好的结果。 另外,desaturate似乎比grayscale更好。

image
    .color([{apply: 'desaturate', params: [90]}])
    .contrast(1)
    .write("img-opt.jpg");

result

您只需要一点点试验和错误即可。