标签: text nltk
有一些语料库用于文本摘要,包含文本的相关句子。但我正在寻找一个包含文本中相关短语的语料库。这意味着,如果T中的S_1, S_2, S_3,... S_n来自S,则我会在p S_n中找到相关短语len(p) = [1,len(S_n)]。 有没有人知道这样的语料库?
T
S_1, S_2, S_3,... S_n
S
p
S_n
len(p) = [1,len(S_n)]