我正在使用带有Python的spaCy进行命名实体识别,但是脚本要求在每次运行时加载模型并加载大约1.6GB的内存来加载它。
但是每次运行1.6GB并不是必需的
如何将其加载到缓存或临时内存中以使脚本运行得更快?
答案 0 :(得分:1)
首先,如果你只做NER,你可以安装没有载体的解析器。 这可以将参数解析器赋予:
python -m spacy.en.download parser
这样可以防止下载 700MB + 手套矢量,减少单次运行所需的内存。
然后,这取决于您对库的应用程序/用法。
如果您经常调用它,最好将spacy.load('en')
传递给在堆栈的开头处加载的模块/类变量。
这会减慢你的启动时间,但spacy将准备好(在内存中)被调用。
(如果启动时间很大,可以延迟加载)。