我有一个AWS RDS(AuroraDB),我想掩盖数据库上的数据。亚马逊是否提供数据屏蔽服务?
我见过RDS加密,但我正在寻找数据屏蔽,因为数据库包含敏感数据。所以我想知道它们是否为数据屏蔽提供了任何服务,还是有其他工具可用于屏蔽数据并手动将其添加到数据库中?
对于我的情况,如果有任何可用于数据屏蔽的工具列表,则非常感谢。因为我需要屏蔽这些数据以进行测试,因为原始数据库包含敏感信息,如PII(个人身份信息)。我还必须将这些数据传输给我的同事,所以我认为数据屏蔽是一个重要因素。
感谢。
答案 0 :(得分:2)
这是一个很棒的问题,我认为您保护业务最有价值资产的主动方法是很多人应该注意的事情,特别是如果您与同事共享数据。让人们只看到他们需要看到的东西是一个无可否认的减少攻击面的好方法。标准的网络安全方法已经不再适用了,大量的攻击/人们丢失了有敏感数据的笔记本电脑/ usbs。毕竟我们只是人类。随着GDPR将于明年5月生效,任何在欧盟拥有客户的公司都必须通过设计展示隐私,并采用屏蔽等匿名技术来表明这一点。
注意:我对此答案有既得利益,因为我正在处理您正在谈论的此类服务。
我们发现,根据您的确切用例,数据集和内容的大小取决于您的屏蔽方法。如果您的数据集具有最少的字段并且您知道PII的位置,则可以运行标准查询来替换敏感值。即约翰 - > XXXX。如果你想保持一些人的可读性,有Python's Faker这样的库可以生成基于随机区域的PII,你可以用你的敏感值替换。 (PHP Faker,Perl Faker和Ruby Faker也存在)。
免责声明:直接向前屏蔽并不能保证完全隐私。认为某人通过交叉引用带有时间戳的IMDB数据或Guardian记者identifying a Judges porn preferences from masked ISP data从掩盖的Netflix数据集中识别个人。由于您的数据集在字段/表格中增加,并且您可能希望为不同的同事设置不同级别的访问权限,因此屏蔽确实变得乏味。即数据科学获得轻微的匿名数据,营销可以访问严重匿名的数据。自由文本字段中的PII很烦人,并且通常了解攻击者可以用来交叉引用的世界上可用的数据是一项重大任务。
service i'm working on旨在通过使用NLP技术自动化流程并充分理解匿名化数学来缓解所有这些问题。我们将其捆绑到一个网络服务中,我们热衷于在AWS市场上推出。因此,我希望能够更多地了解您的用例,如果您希望尽早访问,我们暂时处于私人测试阶段,请告知我们。
答案 1 :(得分:0)
你知道你无法围绕“蒙面”字段构建查询,对吧? RDS加密符合大多数法规遵从性的静态加密要求。您应该专注于防止恶意行为者首先获得对数据库的访问权限,而不是阻止他们在获得访问权后看到值。
也就是说,在将特定字段插入数据库之前,您可以使用AWS KMS服务加密特定字段。
答案 2 :(得分:0)
如果您使用CSV或JSON文件导出或导入数据(即与您的同事共享),那么您可以使用FileMasker。它可以作为AWS Lamdbda函数运行,在S3上读/写CSV / JSON文件。 它仍在开发中,但如果您想尝试测试版,请与我联系。 免责声明:我为FileMasker的开发人员DataVeil工作。