应用错误收集

我使用Python的scikit-learn包来训练SVM分类器（create table myTable ( id int auto_increment primary key, si int not null, -- signed ui int unsigned not null -- unsigned ); insert myTable (si,ui) values (1,1),(-7,8); SELECT data_type,column_type FROM INFORMATION_SCHEMA.COLUMNS WHERE table_schema='so_gibberish' -- my database name and table_name = 'myTable' AND COLUMN_NAME in ('si','ui'); +-----------+------------------+ | data_type | column_type | +-----------+------------------+ | int | int(11) | | int | int(10) unsigned | +-----------+------------------+的一个实例）。现在我在开发的开源网络应用程序中使用这个训练有素的分类器。这个想法很简单：用户输入＆＃34; foo＆＃34;并且分类器用＆＃34; hi，＆＃39; foo＆＃39;属于班级＆＃39;＆＃39;＆＃34;。

在我的本地计算机上，我将训练好的分类器存储在pickle文件中，每次我为应用程序提供时都会加载该文件。很简单。但出于安全考虑，人们不应该打开他们自己创造的腌菜文件。另外，我已经读过一个不应该使用不同scikit-learn版本的pickle.dump和pickle.load scikit-learn对象。

那么，我该如何开源呢？我是否只是将pickle文件与代码一起下载，并希望人们信任并使用正确的scikit-learn版本？不知怎的，这听起来不对 - 我从未克隆过有腌菜文件的存储库。必须有另一种方式。人们通常如何去做？此外，不确定它是否相关，但泡菜相当大（8GB）。

如何在开源应用程序上存储训练有素的分类器？

0 个答案: