如何在开源应用程序上存储训练有素的分类器?

时间:2015-12-05 20:42:21

标签: python-2.7 scikit-learn

我使用Python的scikit-learn包来训练SVM分类器(create table myTable ( id int auto_increment primary key, si int not null, -- signed ui int unsigned not null -- unsigned ); insert myTable (si,ui) values (1,1),(-7,8); SELECT data_type,column_type FROM INFORMATION_SCHEMA.COLUMNS WHERE table_schema='so_gibberish' -- my database name and table_name = 'myTable' AND COLUMN_NAME in ('si','ui'); +-----------+------------------+ | data_type | column_type | +-----------+------------------+ | int | int(11) | | int | int(10) unsigned | +-----------+------------------+ 的一个实例)。现在我在开发的开源网络应用程序中使用这个训练有素的分类器。这个想法很简单:用户输入" foo"并且分类器用" hi,' foo'属于班级''"。

在我的本地计算机上,我将训练好的分类器存储在pickle文件中,每次我为应用程序提供时都会加载该文件。很简单。但出于安全考虑,人们不应该打开他们自己创造的腌菜文件。另外,我已经读过一个不应该使用不同scikit-learn版本的pickle.dump和pickle.load scikit-learn对象。

那么,我该如何开源呢?我是否只是将pickle文件与代码一起下载,并希望人们信任并使用正确的scikit-learn版本?不知怎的,这听起来不对 - 我从未克隆过有腌菜文件的存储库。必须有另一种方式。人们通常如何去做?此外,不确定它是否相关,但泡菜相当大(8GB)。

0 个答案:

没有答案