MLeap实际上是序列化的“格式”吗?

时间:2019-01-10 10:07:28

标签: apache-spark mleap

我开始使用MLeap作为序列化工具,该工具可以将模型保存在Spark或scikit-learn中,并使用MLeap Runtime进行加载以进行推理。它运作良好。

现在,我的目的是在没有MLeap运行时的情况下,将使用MLeap保存的模型加载到我的Java代码以及自己的结构中。我进行了一些调查,没有发现“模式”的任何“格式定义”,只有示例显示了 some 序列化模型的样子。从这个角度来看,看起来MLeap只是一个序列化/反序列化工具,而不是在文档主页上声明的“格式”。

那么,MLeap是“格式”还是序列化工具?我可以在某处找到格式定义或架构吗?

再次,我的目的是了解是否可以为MLeap format 编写自定义序列化/反序列化工具,或者唯一的选择是为此使用MLeap工具?

1 个答案:

答案 0 :(得分:0)

我要说的是,Mleap是一个框架,可以将模型投入生产,而无需在其中训练模型的开销。这导致所需的低等待时间。反序列化绝对是其中的重要部分,实际上您可以自由地存储管道。

我建议您查看使用Mleap创建的捆绑包(zip文件),其中包含导出的管道。大多数序列化都很容易理解:例如,逻辑回归包含在json文件中,该文件具有流水线元素和系数的标识符。基本上是什么定义了逻辑回归模型。