是否有办法避免将撇号包含在命名实体中,并将其作为单独的令牌保留?
例如,我希望在合并以下句子中的各个词后将“的”分开
import spacy
nlp = spacy.load('en')
s = 'Donald Trump\'s role in the negotiations.'
doc = nlp(s)
for ent in doc.ents:
ent.merge(tag=ent.root.tag_, lemma=ent.text, ent_type=ent.label_)
for t in doc:
print(t)
非常感谢!