我有一套动词/句子,我想要做的是......如果两个句子具有相同的含义,那些句子应该被原来的句子取代,之后我会接受这类句子的频率。
我有没有办法在NLTK中做到这一点?欢迎并赞赏这方面的任何建议。 我正在寻找NLP方法。 感谢
答案 0 :(得分:2)
我会考虑使用一些更新的单词/文档嵌入方法来获得句子相似性,例如:
一方面,句子嵌入可以用来轻松地比较句子,另一方面,你有词嵌入,可以平均/总结得到整个句子嵌入。为了比较句子矢量,可以使用诸如余弦相似度的度量。
答案 1 :(得分:1)
我发现了一些可能能够就如何解决这个问题提供一些想法的论文。他们使用WordNet,这是一个可以用来检查单词相似性的语料库,它可以在NLTK上找到:
Corley,Courtney和Rada Mihalcea。 “测量文本的语义相似性。”关于语义对等和蕴涵经验建模的ACL研讨会论文集。计算语言学协会,2005年。 - >在文本层面翻译单词到单词的相似性,我相信你可以将它用于句子。 (https://aclanthology.info/pdf/W/W05/W05-1203.pdf)
Honeck,Richard P.“句子之间的语义相似性。”心理语言学研究杂志2.2(1973):137-151。 - >这是另一篇计算句子之间相似性得分的论文。
我只浏览了这两篇论文,但似乎第一篇论文顺序使用了句法和语义相似技术,而第二篇论文并行使用了它们。
祝你好运,希望这有帮助!