我正在使用图像处理和pytesseract进行文本提取。 我在输出中得到了垃圾字符。我要删除它。请提出任何技术建议。
A = Image.open("C:\\Users\\salaspure\\Desktop\\Shyam\\1.tif")
B = A.crop((437,26,975,138))
pytesseract.image_to_string(B)
输出为:“ ee Aee nena eon Amm Cvahg WALLEY HOPTAL医院无效620阴影LANE ILAS VEGAS NV 891064119”
必填输出:“医院门诊620暗道ILAS VEGAS NV 891064119”