寻找文本中句子之间的语义连贯性

时间:2017-01-10 20:54:54

标签: python vector tf-idf sentence-similarity latent-semantic-analysis

我需要一些帮助来编写基于这些链接link1link2的代码的程序,它们将自动计算a之间的语义相似性。连续句子和b。句子分隔1个插入短语,整个文档(1000个句子)。

提供的代码已经标记并且可以找到语义相似性,但我不知道如何编写新代码来计算(和显示)连续和"介入"之间的语义相似性。整个文本中的句子(a,b)。我不想一遍又一遍地做同样的事情。

1 个答案:

答案 0 :(得分:0)

以下代码应该执行您想要的操作,根据您希望输出格式化的方式进行调整。

with open("sentence_file_name", "r") as sentence_file:
    while x and y:
    x = sentence_file.readline()
    y = sentence_file.readline()
    similarity(x, y, boolean) #boolean set to false or true depending on what you want
    x = y
    y = sentence_file.readline()