我们即将发送一些原始包含出生日期的敏感数据,需要匿名。数据文件是通过一个程序来运行的,该程序应该对数据进行匿名化,但我想仔细检查它是否真的有效。
匿名程序(如果可行)将XML文件中的所有PatientID文件更改为19121212-1212。 (数据的接收者不需要知道两个样本是否来自同一个人,因此不需要编码ID,所有样本上的相同虚假ID都可以。)
所以问题是:如何扩展正则表达式PatientID="\d{8}-\d{4}"
,使其匹配除PatientID="19121212-1212"
之外的所有PatientID字段? (如果匿名者工作,这将无法匹配。)
答案 0 :(得分:0)
就在我即将发送的时候,我有了一个想法并且它有效。而不是不发送问题,而是用解决方案发布它。
PatientID="((?!19121212-1212).){13}"