我正在使用spacy库从文本中识别实体。当我将文本传递给nlp对象时,无法正确识别日期。
文本:10月9日-上午8点见我
已识别->
9(作为枢机主教)
十月。 -8(作为日期)
必需->
10月9日(作为日期)
上午8点(按时间)
所以,请您帮我解决该问题。我是nlp的初学者。
关于, 阿曼
答案 0 :(得分:0)
Spacy很好,但并不完美。看来最好的策略是分割文本,也许使用类似以下的方法:
text = 'meet me 9 Oct. - 8 am'
sections = text.split(' - ')
for section in sections:
doc = nlp(section)
for ent in doc.ents:
print(ent, ent.label_)
当然,如果文本中有多个连字符,则此代码无效,但是您明白了。