寻找文本中单词之间的关系

时间:2014-09-11 13:45:39

标签: python nlp scikit-learn data-mining semantics

在文本中,有时单词往往指向同一个对象。 例如:John is an actor, his father Abraham was Doctor

所以这里his指向John,如果我们有问题Who is John's father?What is John's father's occupation?,我们应该可以回答这个问题,但我不知道知道如何实现这一点。

使用词法分析,解析;使用句子解析我们可以从句子中获得VP, NP, N等。这可以帮助它 - https://pypi.python.org/pypi/pylinkgrammar

潜在语义分析和Probabilistic latent semantic analysis (PLSA)提供关系,可用于分析双模式和共现数据。但尚不清楚如何使用它。

更多有点语义和句法分析。 对此的任何建议或参考将非常感激。

2 个答案:

答案 0 :(得分:4)

你描述的内容被称为共同参照解析,就前一个问题(他的指的是什么?John!)和关系提取一样对于后者(即job(John, actor)job(Abraham,doctor)father(John,Abraham))。

关于这些科目的研究很多。希望ACL Anthology能够提供帮助:

答案 1 :(得分:1)

我认为特定的NLTK依赖库非常适合您的情况:https://code.google.com/p/nltk-drt/

此PDF详细解释了它的工作原理:https://code.google.com/p/nltk-drt/downloads/detail?name=NLTK-DRT.pdf