我正在使用setuptools来打包我的模块,该模块使用经过训练的数据集来处理AI应用程序。特别是,我使用了nltk data files中的vader_lexicon.txt
。
从pip安装nltk时,它不会自动为您下载数据集。您必须从命令行或python解释器手动执行命令才能获取特定数据集。我怀疑他们这样做是因为包括所有数据集将是数百兆字节。
从setuptools的文档中可以看出,包含数据文件的方法是使用MANIFEST.in
,但在这种情况下,您似乎需要将数据文件包含在源代码分发中。
有没有办法包含来自远程位置的数据?