在Python中修复日期错别字

时间:2015-09-09 10:40:03

标签: regex date python-3.x

我需要在OCR&#39d文档中查找日期。使用模糊正则表达式搜索我几乎可以找到每个日期,但问题是有时匹配并不完全正确,dateparser.parser无法识别它。例如,我获得了1 1 Jufy 2012(EN)或12 juiiiet 20I4(FR)

等匹配项

我可以处理数字,而且由于我的知识有限,月份名称的解决方案是创建一个月份表和模糊正则表达式。问题是我必须处理许多语言,所以它可能会变得冗长。有没有更快的方法来修复这样的字符串?

0 个答案:

没有答案