我需要匹配连续的词干。
例如,如果我正在寻找与通常称为“
commission of nutrition
和committee of nutrition
的身体有关的内容,
我希望能够做这样的事情:
comm* of nutrition
。
我对此不太了解正则表达式。
答案 0 :(得分:0)
正如已经说过的那样,不清楚您到底在寻找什么。
听起来您正在寻找与给定文本中任何位置的词干匹配的正则表达式。
这个小正则表达式是一种存档方式
import re
# test-sentences
test = "some text before 'commission of nutrition' and after"
test1 = "committee of nutrition, only after"
test2 = "again before 'committee at nutrition'"
# pattern
reg = r'comm(ission|ittee) of nutrition'
# test-cases
if re.search(reg, test):
print("match found")
else:
print("No match found")
if re.search(reg, test1):
print("match found")
else:
print("No match found")
if re.search(reg, test2):
print("match found")
else:
print("No match found")
# results
match found
match found
No match found