在我的项目的预处理步骤中,我经常使用LabelEncoder()
将状态(例如' California')转换为漂亮的值来训练我的模型。我在 jupyter notebooks 中进行了大量的开发,最终我挑选了我的模型,以便在专门编写的API和Web应用程序后面的单独应用程序中使用。模型很复杂,培训和预处理需要几个小时。
然而,我想使用相同的classes_
我编码和训练模型,但随后在我的API内部。当我启动服务器只是为了访问classes_
时,再次训练模型是不明智的。
更重要的是,我希望在我的小型网络应用中显示的表单中实际提供classes_
选项。我可以简单地用pickle存储这些或者作为普通的json然后在API中读取它们,并使用它们来填充我的表单中的选项,但是应该有一些不那么粗糙的东西,我认为它可能是性能瓶颈或潜在资源猪。这是一个很好的方法吗?
tl;博士:
classes_
得到的LabelEncoder()
来处理我在API上收到的内容。这是一个很好/快速的方法吗?classes_
从LabelEncoder()
获取用于生成表单(在单独的应用程序上),其中这些表格需要显示为选项。它们将由python(flask)应用程序使用。