问题描述:我有兴趣查看文本窗口中的术语,例如左侧3个单词,右侧3个单词。基本情况具有w-3 w-2 w-1项w + 1 w + 2 w + 3的形式。我想在我的文本上实现一个滑动窗口,我可以用它来记录每个术语的上下文单词。因此,每个单词都被视为一个术语,但是当窗口移动时,它变成上下文单词等。但是,当该单词是行中的第一个单词时,左侧没有上下文单词(t w + 1) w + 2 w + 3),当它是第二个单词时,左边只有一个上下文单词,依此类推。因此,我对实现这个灵活的滑动窗口(在Python中)的任何提示感兴趣,而无需单独编写和指定每种可能的情况。
回顾一下:
输入示例:
[“w1”,“w2”,“w3”,“w4”,“w5”,“w6”,“w7”,“w8”,“w9”,“w10”]
输出:
t1 w2 w3 w4
w1 t2 w3 w4 w5
w1 w2 t3 w4 w5 w6
w1 w2 w3 t4 w5 w6 w7
__ w2 w3 w4 t5 w6 w7 w8
__ __等。
我目前的计划是为输出中的每一行创建一个单独的条件。
答案 0 :(得分:6)
如果您想要n
个单词的滑动窗口,请使用最大长度为n
的双端队列来实现缓冲区。
这应该说明这个概念:
mystr = "StackOverflow"
from collections import deque
window = deque(maxlen=5)
for char in mystr:
window.append(char)
print ( ''.join(list(window)) )
输出:
S
St
Sta
Stac
Stack
tackO
ackOv
ckOve
kOver
Overf
verfl
erflo
rflow