如何将spaCy模型保存到缓存中?

时间:2016-07-08 09:35:05

标签: python caching spacy

我正在使用带有Python的spaCy进行命名实体识别,但是脚本要求在每次运行时加载模型并加载大约1.6GB的内存来加载它。
但是每次运行1.6GB并不是必需的 如何将其加载到缓存或临时内存中以使脚本运行得更快?

1 个答案:

答案 0 :(得分:1)

首先,如果你只做NER,你可以安装没有载体的解析器。 这可以将参数解析器赋予:

python -m spacy.en.download parser

这样可以防止下载 700MB + 手套矢量,减少单次运行所需的内存。

然后,这取决于您对库的应用程序/用法。

如果您经常调用它,最好将spacy.load('en')传递给在堆栈的开头处加载的模块/类变量。

这会减慢你的启动时间,但spacy将准备好(在内存中)被调用。

(如果启动时间很大,可以延迟加载)。