如何使用正则表达式删除垃圾单词(非英语单词)?

时间:2019-07-02 12:17:13

标签: python regex python-3.x computer-vision ocr

我正在使用图像处理和pytesseract进行文本提取。 我在输出中得到了垃圾字符。我要删除它。请提出任何技术建议。

A = Image.open("C:\\Users\\salaspure\\Desktop\\Shyam\\1.tif")
B = A.crop((437,26,975,138))
pytesseract.image_to_string(B)

输出为:“ ee Aee nena eon Amm Cvahg WALLEY HOPTAL医院无效620阴影LANE ILAS VEGAS NV 891064119”

必填输出:“医院门诊620暗道ILAS VEGAS NV 891064119”

0 个答案:

没有答案