我使用Python的scikit-learn包来训练SVM分类器(create table myTable
( id int auto_increment primary key,
si int not null, -- signed
ui int unsigned not null -- unsigned
);
insert myTable (si,ui) values (1,1),(-7,8);
SELECT data_type,column_type
FROM INFORMATION_SCHEMA.COLUMNS
WHERE table_schema='so_gibberish' -- my database name
and table_name = 'myTable' AND COLUMN_NAME in ('si','ui');
+-----------+------------------+
| data_type | column_type |
+-----------+------------------+
| int | int(11) |
| int | int(10) unsigned |
+-----------+------------------+
的一个实例)。现在我在开发的开源网络应用程序中使用这个训练有素的分类器。这个想法很简单:用户输入" foo"并且分类器用" hi,' foo'属于班级''"。
在我的本地计算机上,我将训练好的分类器存储在pickle文件中,每次我为应用程序提供时都会加载该文件。很简单。但出于安全考虑,人们不应该打开他们自己创造的腌菜文件。另外,我已经读过一个不应该使用不同scikit-learn版本的pickle.dump和pickle.load scikit-learn对象。
那么,我该如何开源呢?我是否只是将pickle文件与代码一起下载,并希望人们信任并使用正确的scikit-learn版本?不知怎的,这听起来不对 - 我从未克隆过有腌菜文件的存储库。必须有另一种方式。人们通常如何去做?此外,不确定它是否相关,但泡菜相当大(8GB)。