从Python的简历中提取人名

时间:2017-11-11 14:52:03

标签: python-3.x nlp data-science spacy

大家知道通常在简历顶部的人名,所以我在CV上使用spaCy库进行NER(名称实体识别)标记,然后我提取 PERSON 的第一个标签(希望它应该是人名。有一段时间它对我有用,但有一段时间它给了我其他不是名字的东西(因为spaCy甚至不识别任何 NER 标签的名字),所以它给了我一些其他的东西它被认为是 PERSON 它可能就像'Curriculam vitae'显然这是我不想要的。 以下是我正在谈论的代码...

import spacy
import docx2txt

nlp = spacy.load('en_default')
my_text = docx2txt.process("/home/waqar/CV data/Adnan.docx")
doc_2 = nlp(my_text)
for ent in doc_2.ents:
    if ent.label_ == "PERSON":
        print('{}'.format(ent))
        break

我有什么方法可以在spaCy中为'PERSON'标签添加一些名称给NER,因为它可以识别用CV写的人名 我认为我的逻辑很好但是我缺少的东西...... 如果你们这些人帮助我,我会非常感激,因为我是学生,也是蟒蛇的初学者,希望你们人民肯定会提出一些建议

OutPut

Abdul Ahad Ghous

但是有一段时间它给了我OutPuts,如NER认为它是一个PERSON,甚至不给这个CV中的人名提供任何标记。

Curriculum Vitae

0 个答案:

没有答案