从文档列表中提取有关某人的个人信息并进行汇总

时间:2019-03-07 13:31:33

标签: nlp nltk

我需要从文档列表中提取有关某个人的个人信息,并将其汇总给用户。如果有2个人同名,则应标识正确的人。如果此人有昵称,则还需要识别。程序的输入可以是人名,地址,组织名称等。我使用NLTK库从文本中提取了诸如人,组织,位置等命名实体。下面提到提取命名实体后的输出,

[(''Michael','NNP','B-PERSON'),('Joseph','NNP','B-PERSON'),('Jackson','NNP','I-PERSON' ),('was','VBD','O'),('born','VBN','O'),('in','IN','O'),('Gary',' NNP”,“ B-GPE”),(“,”,“,”,“ O”)(“印第安纳州”,“ NNP”,“ B-GPE”)。...

现在,我想提取这些实体之间的关系。

1 个答案:

答案 0 :(得分:1)

您的任务确实与NLP信息提取有关。看看这里以获得概述会更好。 Stanford Information extraction

此外,如果名称重复,则可以使用一种称为“实体链接”的技术来解决该问题。

当您要输出更准确的结果时,文档标题也可以作为条件。

这是NLP中信息提取的示例。 希望这会有所帮助!

enter image description here