从文本中提取建议/建议

时间:2016-12-08 04:35:55

标签: nlp nltk named-entity-recognition

我的文件通常包括以下句子:

  

如果我知道这件事,我会阻止这个问题

  

如果John被告知,这不会发生

  如果杰森聪明的话,这不会是个问题

我有兴趣提取这些信息(不确定它们被称为语言学)。因此,我想提取整个句子,或者理想情况下,提取如下的摘要:

  

(告知约翰)(防止)

大多数(如果不是全部)我遇到的关系提取和信息提取的例子都遵循相当标准的流程: 做NER,然后关系提取寻找像“in”或“at”等的关系(例如nltk书的ch7)。

这些类型的句子是否属于NLP的某一类别?是否有类似这样的论文/教程?

1 个答案:

答案 0 :(得分:2)

当您要求就一个非常开放的主题提出建议时,请提供更多示例。我的意思是说,如果你只举一个例子并解释你的目标是什么,就不会提供足够的信息。例如,如果您的句子遵循特定的模式,那么从它们中提取信息(以您想要的格式)变得更容易。否则,它成为广泛而复杂的研究问题!

从您的示例中,您似乎想要提取句子的head words和其他修改这些头部的单词。您可以使用依赖项解析来完成此任务。看看Stanford Neural Network Dependency Parser。依赖解析器分析句子的语法结构,建立“头”单词和修改这些单词的单词之间的关系。所以,我相信它可以帮助你完成你想要的任务。

如果你想使它更通用,那么这个问题与开放信息提取很好地吻合。您可以考虑查看Stanford OpenIE api。

您可以在任务中考虑Stanford Relation Extractor api。但我坚信通过依赖解析的关系提取最适合您的问题定义。您可以阅读此paper以了解并在您的任务中使用它们。