逆向工程师scikit-learn序列化模型

时间:2018-11-14 16:25:18

标签: python machine-learning scikit-learn pickle joblib

我试图理解序列化scikit-learn / keras拟合模型的安全隐患(使用pickle / joblib等)。

特别是,如果我要处理不想被透露的数据,是否总会有人对模型适合的数据进行反向工程?还是数据,只是算法为算法更新相关系数/权重的一种方式? (如果我针对“这部电影很棒”训练模型并将其存储为foo.pkl文件,如果我所拥有的全部,我是否还能够加载foo.pkl并说它是针对“这部电影很棒”训练的?访问的是pkl文件而不是数据)

1 个答案:

答案 0 :(得分:-1)

不,您不能(原则上)基于模型对数据进行反向工程。您显然可以得出训练后的模型权重/等值,并开始对可能经过训练的模型有一个很好的了解,但是直接得出数据,我不知道这样做的任何可能方法,前提是您要腌制训练有素的模型。