替换姓氏/名字的所有变体

时间:2019-06-24 20:11:15

标签: regex string nlp

背景

我有以下代码是#Replace a name in a string in Python

的变体
s = "The myth of Johnny Appleseed states that he ate many apple seeds"
s.replace('Johnny Appleseed','***')

输出

'The myth of *** states that he ate many apple seeds'

问题

但是,如果名字和姓氏包含许多变体(非详尽列表)

#misspellings 
Johnny Applseed
Johny Appleseed
Johnny Applesee

#Letter case 
johnny appleseed
JOHNNY APPLESEED
JoHny ApPleseED

问题

如何获得与上述相同的输出

'The myth of *** states that he ate many apple seeds'

姓氏和姓氏中是否包含所有或所有这些变体形式?

1 个答案:

答案 0 :(得分:0)

好问题!

如果我们知道那将是约翰尼,那么我们将以类似于以下内容的表达式开始:

.csproj

如果没有,我们将设计一个封闭的表达式,然后我们将权衡所需的准确性。

Please see the demo for additional info and explanation in here