给定文本,单词和间隔,以最有效的方式返回包含该范围内的单词的子字符串。我们的想法是,在查询时返回字词ocurr的上下文,类似于Google的内容。
例如:
text = "This is an example of a string"
word = "example"
interval = 2
返回:
"is an example of a"
谢谢。
答案 0 :(得分:0)
我不确定这是你问题的最佳解决方案,但是......
outer_pattern = ''
for i in range(interval):
outer_pattern += '\w+ '
pattern = '{}{} {}'.format(outer_pattern, word, outer_pattern)
result = [text[match.start():match.end()] for match in re.finditer(pattern, text)]
结果这里是所有比赛的列表