我需要从文档列表中提取有关某个人的个人信息,并将其汇总给用户。如果有2个人同名,则应标识正确的人。如果此人有昵称,则还需要识别。程序的输入可以是人名,地址,组织名称等。我使用NLTK库从文本中提取了诸如人,组织,位置等命名实体。下面提到提取命名实体后的输出,
[(''Michael','NNP','B-PERSON'),('Joseph','NNP','B-PERSON'),('Jackson','NNP','I-PERSON' ),('was','VBD','O'),('born','VBN','O'),('in','IN','O'),('Gary',' NNP”,“ B-GPE”),(“,”,“,”,“ O”)(“印第安纳州”,“ NNP”,“ B-GPE”)。...
现在,我想提取这些实体之间的关系。
答案 0 :(得分:1)
您的任务确实与NLP信息提取有关。看看这里以获得概述会更好。 Stanford Information extraction。
此外,如果名称重复,则可以使用一种称为“实体链接”的技术来解决该问题。
当您要输出更准确的结果时,文档标题也可以作为条件。
这是NLP中信息提取的示例。 希望这会有所帮助!