如何使用NLTK从句子中提取特定信息

时间:2016-10-31 20:45:11

标签: python dependencies nlp nltk

我是使用Python和NLTK进行NLP操作的新手。从不同的句子开始,我想知道如何在句子中提取某些依赖关系。

例如: 爱德华有一件黑色夹克和带红色鞋带的白色鞋子

使用POS标记我可以提取某些词性,但我想特别提取他有一件黑夹克,最终列出如下信息:

姓名:爱德华

服装:黑色外套

鞋子:带红色鞋带的白色鞋子

2 个答案:

答案 0 :(得分:2)

您正在寻找的是NER(命名实体识别)。由于每个句子结构都不同,并且它们所需的信息不同,您可能需要自己创建here的模板或工作示例。

还有很多可用的语料库。

答案 1 :(得分:1)

您可以将问题视为提取关系元组,可以作为二元关系。在这种情况下,您需要了解open IE。在这种情况下,您可以提取关系元组,如,或。如果您有监督数据,则可以构建自己的关系提取模型。否则,使用NER或POSTAGging等其他技术提取名称,衣服或其他重要信息并不容易。

一种替代方法可以是依赖性解析,但我不确定如何对其进行建模以适应您的特定需求。