我想知道是否有可能使用spaCy,NLTK(或其他提供某些命名实体识别功能的库)在检测到的PERSON实体中将姓氏与姓氏分开。
让我们假设一个带有spaCy的简单代码段,如下所示:
import spacy
nlp = spacy.load("fr_core_news_sm")
doc = nlp(u"""
Joseph Abbal
Charles de Montalembert
""")
for ent in doc.ents:
print(ent.text, ent.label_)
# Joseph Abbal PER
# Charles de Montalembert PER
借助命名实体识别库,有没有办法使“约瑟夫”是一个姓氏,而“阿伯巴尔”是一个姓氏,还是我们处于计算机编程中无法解决的经典名称问题中(如此处{ {3}})?