在云端部署机器学习模型时是否存在任何特定的企业安全问题

时间:2019-05-11 15:40:51

标签: security machine-learning deployment

我们正在构建一个平台,旨在为具有重大数据安全问题的大型企业提供机器学习解决方案。所有数据训练均在前提下进行,但要限制用于模型训练的数据的性质。模型完成后,我希望将其部署到具有标准安全性/审核标准的云上。(IP白名单,访问令牌,日志)

我相信这些功能可以匿名完成(标准化,PCA等),以提供额外的安全性。 发送到基于云的ML模型的数据可以通过任何方式返回到原始数据吗?

虽然我已经回顾了有关模型部署的其他问题,但是安全性的这一方面并未专门处理。 https://dzone.com/articles/security-attacks-analysis-of-machine-learning-mode (不必担心可用性或模型失真,而应关注机密数据)

同样,想法是在本地保留学习和数据,仅在云上进行部署以提高速度,灵活性和可用性。

1 个答案:

答案 0 :(得分:0)

  

发送到基于云的ML模型的数据是否可以通过任何方式返回到原始数据?

任何具有反函数的函数都可以返回原始数据。风险不仅来自于随机的人查看数据,而且还来自团队内部的内部威胁。这是一个示例:

How to reverse PCA and reconstruct original variables from several principal components?

根据主成分的数量,可能还可以通过蛮力猜测本征向量。