我使用以下方法训练了分类器:
https://spacy.io/usage/examples#textcat
我还创建了一些自定义管道组件,类似于:
https://spacy.io/usage/examples#custom-components-entities
现在我正在尝试打包生成的nlp管道
(en_core_web_lg +分类器+自定义管道组件)
使用https://spacy.io/api/cli#package和https://spacy.io/usage/training#models-generating。
但是,我在理解input_dir结构应该是什么样,和/或如何编写__init__.py来正确打包整个管道方面遇到麻烦;带有原始的en_core_web_lg组件,以及分类器和我的自定义组件。
我想这样做,以便可以对模型进行版本控制,并轻松将它们作为独立的tar.gz软件包进行部署。我确实看到了这个https://github.com/explosion/spaCy/pull/2348,但是我不需要打包单个管道组件。如果还有其他方法可以帮助我对管道进行版本管理并使其易于部署,则欢迎提出建议。我对此还比较陌生,因此可能会遗漏一些明显的东西。
谢谢!