Spacy:ner确定的日期不正确

时间:2018-08-22 04:18:20

标签: python nlp nltk spacy

我正在使用spacy库从文本中识别实体。当我将文本传递给nlp对象时,无法正确识别日期。

文本:10月9日-上午8点见我

已识别->

9(作为枢机主教)

十月。 -8(作为日期)

必需->

10月9日(作为日期)

上午8点(按时间)

enter image description here

所以,请您帮我解决该问题。我是nlp的初学者。

关于, 阿曼

1 个答案:

答案 0 :(得分:0)

Spacy很好,但并不完美。看来最好的策略是分割文本,也许使用类似以下的方法:

text = 'meet me 9 Oct. - 8 am'
sections = text.split(' - ')
for section in sections:
    doc = nlp(section)
    for ent in doc.ents:
        print(ent, ent.label_)

当然,如果文本中有多个连字符,则此代码无效,但是您明白了。