正则表达式匹配部分正确的关键字

时间:2018-06-15 09:13:48

标签: python regex

我想将字符串与关键字匹配。关键字可能不完全匹配,最大不匹配字符设置为2.

如何使用正则表达式来完成它?

感谢。

以下是示例:

string                     partially matched 'abc technology.com'?
apc technology.om                       yes(wrong p and miss c)
abctechnologycom                        yes(miss space and dot)
abc technolog.con                       yes(miss y and wrong n)
abtechnology.com                        yes(miss c and space)
abc technology.c                        yes(miss o and m)
abtechnology.co                         no(miss c, space and m)
abc technology.                         no(miss com)
abctechnology.c                         no(mis space and om)

1 个答案:

答案 0 :(得分:3)

您可以使用regex库并使用模糊匹配(适合您的用例),指定最大不匹配,例如:

import regex
from pprint import pprint

matcher = regex.compile(r'(abc technology\.com){e<3}')

tests = [
  "apc technology.om",
  "abctechnologycom",
  "abc technolog.con",
  "abtechnology.com",
  "abc technology.c",
  "abtechnology.co",
  "abc technology.",
  "abctechnology.c",
]

for test in tests:
  pprint(matcher.match(test))

Online demo here

当命中错误计数时,它将返回None,否则将返回包含fuzzy_counts元组的对象,该对象为您提供替换,插入,删除的总数。它还包含一个fuzzy_changes元组,其中包含每个替换,插入和删除的位置。