我想使用以下字典的values()
使用正则表达式模式识别单词子集。
creategarbageterms = {'tim_tam' : ['tim_tam','yummy_tim_tam', 'berry_tim_tam'],
'pudding': ['pudding', 'chocolate_pudding', 'biscuits', 'tiramusu'],
'ice_cream': ['ice_cream', 'vanilla_ice_cream']}
即,给出以下字符串;
**Term -> Output**
wow_yummy_tim_tam -> yes
melted_tim_tam ->yes
berry_tim_tam -> Yes
cherry_berry_tim_tam -> yes
wow_tam -> No
wow_m -> No
wow_ti -> No
Wow_tim_t -> No
我目前的代码/模式如下。
creategarbageterms = {'tim_tam' : ['tim_tam','yummy_tim_tam', 'berry_tim_tam'],
'pudding': ['pudding', 'chocolate_pudding', 'biscuits', 'tiramusu'],
'ice_cream': ['ice_cream', 'vanilla_ice_cream']}
pattern = re.compile(r'|'.join([r'(\s|\b){}\b'.format(x) for x in creategarbageterms.values()]))
if re.findall(pattern, "wow_m".replace("_", " ")):
print("yes")
else:
print("no")
但是,在我目前的代码中,上述No
条款也会被接受。请让我知道我错在哪里?
答案 0 :(得分:1)
我不相信你需要正则表达式来检查字符串中是否存在。相反,请使用in
和re
拆分字符串:
import re
creategarbageterms = {'tim_tam' : ['tim_tam','yummy_tim_tam', 'berry_tim_tam'],
'pudding': ['pudding', 'chocolate_pudding', 'biscuits', 'tiramusu'],
'ice_cream': ['ice_cream', 'vanilla_ice_cream']}
s = ['wow_yummy_tim_tam', 'melted_tim_tam, berry_tim_tam', 'cherry_berry_tim_tam', 'wow_tam', 'wow_m', 'wow_ti', 'Wow_tim_t']
for c in s:
truthy = any(any(i in c for i in b) for a, b in creategarbageterms.items())
if truthy:
print("Yes")
else:
print("no")
输出:
Yes
Yes
Yes
no
no
no
no