我想知道是否有办法使用NLP(特别是python中的nltk模块)来查找句子内主语之间的相似性。问题在于,文本在单独的句子中引用主题,而不是通过名称具体引用它们(例如www.legaltips.org/Alabama/alabama_code/2-2-30.aspx)。任何想法或经验都会非常有用。
答案 0 :(得分:1)
对你的问题的简短回答是肯定的。 :)
听起来你要解决的问题就是我们在NLP中称之为回指或共同引用的解决方案 - 尽管这只是指通过不同的句子跟踪相同的指示物。您可以尝试在此处开始使用:http://nlp.stanford.edu/software/dcoref.shtml
如果你想找到简单的相似之处,那么这完全是一个不同的问题 - 你应该让人们知道你在谈论什么样的相似之处 - 语义,合成等......然后你就可以得到一个答案(如果那样的话)是你的问题。)