我正在尝试确定重复格式的文本文档中是否存在子字符串。我正在遍历特定的关键字,并尝试在其后识别另一个单词。这两个词总是由一个可变值的整数分隔。我基本上希望有一种方法可以将子字符串中的整数表示为所有整数值(如果有的话)。 像这样:
substr = keyword +' '+ integer +' '+ word
teststr = "one two three keyword 24 word four five"
if substr in teststr:
print("substr exists in teststr")
或者,我可以做一个循环并检查迭代器:
for el in teststr():
checkstr = keyword +' '+ el.isdigit +' '+ word
if checkstr in teststr:
print("yes")
只是想知道是否有人知道他们头上的优雅解决方案。
答案 0 :(得分:1)
您可以使用正则表达式捕获该模式。这是您要寻找的内容的快速实现:
import re
sample = "one two three keyword 24 word four five, another test is here pick 12 me"
# (\w+) is a group to include a word, followed by a number (\d+), then another word
pattern = r"(\w+).(\d+).(\w+)"
result = re.findall(pattern, sample)
if result:
print('yes')