不要在Spacy命名实体中包含撇号

时间:2018-07-10 17:28:16

标签: spacy

是否有办法避免将撇号包含在命名实体中,并将​​其作为单独的令牌保留?

例如,我希望在合并以下句子中的各个词后将“的”分开

import spacy
nlp = spacy.load('en')

s = 'Donald Trump\'s role in the negotiations.'
doc = nlp(s)

for ent in doc.ents:
    ent.merge(tag=ent.root.tag_, lemma=ent.text, ent_type=ent.label_)

for t in doc:
    print(t)

非常感谢!

0 个答案:

没有答案