Spacy 2.0中支持的日期和时间格式是什么

时间:2018-06-11 07:35:50

标签: spacy

我在我的应用程序中使用以下模型:

en_core_web_sm

xx_ent_wiki_sm

我想知道默认Spacy模型可以提取的支持日期和时间格式。

使用的Python版本:3.6 使用spaCy版本:2.0.x

1 个答案:

答案 0 :(得分:3)

英语模型在OntoNotes 5语料库上进行训练,该语料库支持more extensive label scheme,包括DATETIME

xx_ent_wiki_sm模型是在维基百科语料库上使用more limited标签方案进行培训,仅识别PERLOCORG和{{1}开箱即用(model details here)。

当使用模型提取日期和时间的提及时,记住它是一个统计过程很重要 - 所以你看到的结果将取决于上下文和模型的数据。训练有素。根据您正在使用的文本,您可能希望update and fine-tune预先训练的模型包含更多针对您的应用程序的示例,或者尝试使用基于规则的方法。另请参阅this thread以获取有关日期和时间解析的更多详细信息。