使用正则表达式,如何将单词缩小到更准确的匹配

时间:2014-02-07 17:01:08

标签: python regex

我有一个包含巨大单词列表的文本文件... 然后我有一个缩短版本的单词

示例 mthr 需要成为母亲而非无母

使用正则表达式我需要带回缩写词“mthr”中的辅音而不是其他任何东西......这样做会带回更精确的单词。

有谁知道怎么做?我大部分时间都被困在这一部分。

谢谢

1 个答案:

答案 0 :(得分:1)

在给出缩写mother时会找到mthr的正则表达式是:

^[aeiou]*m[aeiou]*t[aeiou]*h[aeiou]*r[aeiou]*$

即。给出一个缩写,在每个字母之间以及开始和结束锚点之间以及第一个/最后一个字母之间加上`[aeiou] *,它匹配任何元音序列。

请注意,如果这些缩写位于您的单词列表中,则该缩写也会匹配mauthermethermouther