我正在使用Tesseract库从图像中提取文本。语言是越南语。我有两张照片。第一个来自一个网站。第二个是从Wordpad程序中截取的截图。它们显示在下面的链接中:
第一个准确率为95%。
Báncănhộtầng5khutậpthểThànhcôngBắc,DT 28m2,gầnchợThànhCông, 所以 đỏ,chínhchủ,giá800trệu.LH:A.Châu,0979622551,0905685336
第二张图片要大得多,但准确度只有60%左右。
Bặncănhộtầngậkhutậpthểểhànhgông BAC。 llĩ28平方米。 gânchợợllànhBông。 sũIlỏ。 chínhl:lIlì。 giá800lriệu。 l.ll:A.BhâU, 0979622551,0905685336
我必须修复第二张图片以获得与第一张图片一样准确的文字吗?
答案 0 :(得分:0)
正如@ {{{{{{}}中的@ user898678所述 以下操作可以提高OCR的准确性: