我在我的应用程序中使用以下模型:
en_core_web_sm
xx_ent_wiki_sm
我想知道默认Spacy模型可以提取的支持日期和时间格式。
使用的Python版本:3.6 使用spaCy版本:2.0.x
答案 0 :(得分:3)
英语模型在OntoNotes 5语料库上进行训练,该语料库支持more extensive label scheme,包括DATE
和TIME
。
xx_ent_wiki_sm
模型是在维基百科语料库上使用more limited标签方案进行培训,仅识别PER
,LOC
,ORG
和{{1}开箱即用(model details here)。
当使用模型提取日期和时间的提及时,记住它是一个统计过程很重要 - 所以你看到的结果将取决于上下文和模型的数据。训练有素。根据您正在使用的文本,您可能希望update and fine-tune预先训练的模型包含更多针对您的应用程序的示例,或者尝试使用基于规则的方法。另请参阅this thread以获取有关日期和时间解析的更多详细信息。