标签: regex date python-3.x
我需要在OCR&#39d文档中查找日期。使用模糊正则表达式搜索我几乎可以找到每个日期,但问题是有时匹配并不完全正确,dateparser.parser无法识别它。例如,我获得了1 1 Jufy 2012(EN)或12 juiiiet 20I4(FR)
dateparser.parser
1 1 Jufy 2012
12 juiiiet 20I4
我可以处理数字,而且由于我的知识有限,月份名称的解决方案是创建一个月份表和模糊正则表达式。问题是我必须处理许多语言,所以它可能会变得冗长。有没有更快的方法来修复这样的字符串?