应用错误收集

逆向工程师scikit-learn序列化模型

时间：2018-11-14 16:25:18

标签： python machine-learning scikit-learn pickle joblib

我试图理解序列化scikit-learn / keras拟合模型的安全隐患（使用pickle / joblib等）。

特别是，如果我要处理不想被透露的数据，是否总会有人对模型适合的数据进行反向工程？还是数据，只是算法为算法更新相关系数/权重的一种方式？（如果我针对“这部电影很棒”训练模型并将其存储为foo.pkl文件，如果我所拥有的全部，我是否还能够加载foo.pkl并说它是针对“这部电影很棒”训练的？访问的是pkl文件而不是数据）

1 个答案:

答案 0 :(得分：-1)

不，您不能（原则上）基于模型对数据进行反向工程。您显然可以得出训练后的模型权重/等值，并开始对可能经过训练的模型有一个很好的了解，但是直接得出数据，我不知道这样做的任何可能方法，前提是您要腌制训练有素的模型。