如何在两个不同的文本文件(两个文档)中找到语义相似的段落

时间:2019-01-28 11:10:47

标签: nlp gensim recurrent-neural-network

我发现了很多类似的问题,没有一个能回答我的问题,有人可以帮助我。我需要查找两个法律文件,它们在上下文上是相同的或具有相同的含义,应采用的方法是什么。我想到无论何时何地,我都会让人们使用一两个句子来进行比较。我想对许多文档进行处理,然后找出其中哪些相似的文档无法使我着手如何开始工作

1 个答案:

答案 0 :(得分:0)

我认为您正在描述Doc2Vec的目的。您可以训练该模型以生成可用于测量相似性的文档向量。如果您听说过Word2Vec,则与文档级别的内容有关。您可能需要调整模型以使其按预期运行,但这至少是一个好的开始。

Doc2Vec Official Documentation

Doc2Vec Tutorial